大模型日报(4月22日 资讯篇)

欢迎观看大模型日报站(活动录屏复盘聚集地)

大模型日报(4月22日 资讯篇)

推特

01

Jim Fan: Llama-3正在缩小与GPT-4之间的差距,但多模态模型还需要赶上

Llama-3正在缩小与GPT-4之间的差距,但多模态模型还需要赶上。像LlaVA这样的开放模型在视觉能力方面远远落后于GPT-4V。视频模型就更糟了。它们经常出现幻觉,无法对复杂的场景和动作给出详细的描述。像具身AI和生成媒体这样的应用需要比语言更多的视觉能力。我们还需要更好的基准:
lmsys.org 类似于多模态语言模型竞技场这样的东西,以ELO分数来衡量 “野外氛围”。是时候集中精力在更多像素上了!
大模型日报(4月22日 资讯篇)https://x.com/DrJimFan/status/1782072699705250204
02

Box CEO Levie:人工智能的下一个重大突破是AI代理

从被用作聊天助手,转变为使用AI完成原本可能需要人类执行的完整任务。这将AI从”只读”操作转变为基本的”读/写”操作。最终,这使我们更接近AI的全部承诺,特别是在企业中,AI可以开始完成工作流程的任何部分,我们已经看到了代理编写整个软件应用程序或响应客户支持票证的例子。在许多方面,今天的代理就像2007年的云计算;也就是说,非常早期。当你将这一趋势推断出十年后,我们可以开始想象一个完全不同的企业运作可能是什么样子。我们可以轻松地想象,组织中的每个职能部门都有高效的代理可用,使重要工作得以比现在更快完成。代理对企业的影响确实没有限制,但有3个重大影响让我印象深刻:
  1. 各种规模的企业都将获得他们原本无法利用的资源和专业技能。Sun Microsystems的联合创始人Bill Joy曾说过一句名言:”无论你是谁,最聪明的人都为别人工作。”尤其对于小公司来说,这一直是一个劣势。你的大型竞争对手总是能够利用你无法负担或无法获得的人才库。无论是专门的法律支持,还是扩大销售团队,AI代理将使各种规模的公司都能获得曾经只有大型组织才有的资源。
  2. 公司将能够将精力和人才重新分配到越来越多的差异化和高影响力的工作中。我们知道,对于公司的各个部分,我们的时间都浪费在计算机应该非常擅长解决但现在还无法解决的任务上。随着AI代理变得更加强大,我们耗费时间的许多活动都可以自动化,我们可以将时间和精力重新用于推动更多创新,更接近客户,更好地支持客户等。
  3. 随着AI代理在公司运营中发挥有意义的作用,这改变了IT职能的性质,使其比现在更具战略意义。今天,IT通常专注于为公司现有的工作人员或工作流程提供软件支持。未来,公司也将向IT寻求为企业提供智力动力。想象一下,去找IT不仅仅是说”我需要软件来帮助我的工程师开发产品”,而是”我需要软件来设计我的产品”。你可以眯着眼睛想象,在未来几年,甚至会出现一个”AI工作日”,在那里你管理在公司运营中发挥作用的代理。而这仅仅是个开始……
大模型日报(4月22日 资讯篇)
大模型日报(4月22日 资讯篇)
大模型日报(4月22日 资讯篇)https://x.com/levie/status/1782164161553961069
03

Laura Wendel:扎克伯格可能已经扼杀了OpenAI和所有其他大型专有AI供应商

我使用Llama 3越多,就越觉得扎克伯格可能已经扼杀了OpenAI和所有其他大型专有AI供应商。最新的GPT4和Llama 70b之间的差距几乎不存在。即使OpenAI现在发布GPT5,正在训练的400b Llama 3仍然很可能处于同一水平,再次缩小开源和专有之间的差距。
OpenAI的收入为20亿美元,很可能是非常不盈利的。Meta的毛利超过1000亿美元。在计算能力和人才方面,他们可能比OpenAI高出至少10倍——说到人才,绝大多数AI研究人员认为开源工作比封闭的营利性工作更有吸引力;所以顶尖人才很可能最终会流向Meta。谷歌仍然陷入AI扼杀其主要收入线的问题,所以很可能永远无法像Meta那样全力以赴。
我认为,从这一切中获益最大的将是应用开发者,因为你可以选择任何托管Llama 3的API服务,或者直接按照自己的条件托管它。
到目前为止,大多数AI产品只是API端点的华丽包装。但是,如果你设法将AI深度集成到产品中,让用户甚至不必考虑他们正在与AI交互(例如,根据用户上下文进行幕后调用,结合RAG,将其馈送到你的内部API格式,多步推理/规划等),你可能拥有一项非常可持续的业务,只会随着基础模型变得越来越先进而不断改进。
但是,供应商风险/依赖性不应再成为AI开发人员的担忧。再加上硬件只会变得更快/更便宜的事实;确实有无限的机会来颠覆现有的软件领域,其中很多我们现在可能甚至无法想象,但事后看来却显而易见。
大模型日报(4月22日 资讯篇)
大模型日报(4月22日 资讯篇)https://x.com/Lauramaywendel/status/1782040453266710551
04

谷歌深度学习Chollet:目前我们还只是触及了表面,AGI似乎并没有变得更近,但扩大深度学习的实际应用并不会放缓

你以为LLM聊天机器人需要大量计算?那还不算什么。当全生成式的TikTok/YouTube进入主流时,你才会开始需要大量的GPU。计算量将是现在的数个数量级,一方面是因为媒体更加密集,另一方面是因为受众将扩大5到10倍。目前我们还只是触及了表面。
AGI似乎并没有变得更近,但扩大深度学习的实际应用并不会放缓。
大模型日报(4月22日 资讯篇)https://x.com/fchollet/status/1782264242517000479
05

Naklecha发布最大Minecraft问答数据集,涵盖MC中的每个主题、物品、方块、机制和制作

今天,我发布了有史以来最大的Minecraft问答数据集,包含70万个问答对——它们涵盖了Minecraft中的每个主题、物品、方块、机制和制作。这个数据集是通过提取超过18,000个Minecraft维基页面和在8个H100上运行超过11小时的Llama3生成的。

大模型日报(4月22日 资讯篇)https://x.com/naklecha/status/1782087485289304126

06

Gary Marcus:如果你渴望AGI,不要通过制造表面上看起来像人类错误的东西来安慰自己

很多人对人类认知错误和LLM幻觉之间的关系感到困惑,所以我写了这个简短的解释:
人类说不实之词有许多不同的原因
  • 有时他们撒谎
  • 有时他们记错了事情
  • 有时他们没有仔细考虑自己说的话
  • 有时他们嗑药
  • 有时他们患有精神障碍等
LLM的错误是由不同的潜在过程导致的。它们没有(例如)意图、自我或经济利益,所以它们不会撒谎。它们不吸毒。它们没有情绪状态。相反,LLM的 “幻觉” 经常出现,因为(a)它们确实不知道真假之间的区别,(b)它们没有可靠的推理过程来保证它们的推论是正确的,(c)它们无法对自己的工作进行事实检查。
相反,LLM所说的一切——无论真假——都来自同一个统计重构过程,即在某些情况下哪些词可能出现。它们从不检查自己所说的事实。有些是真的;有些是假的。但即使有完美的数据,随机重构过程仍会产生一些错误。LLM用来泛化的过程也会产生幻觉。(在我2001年的书中,我解释了一个不同的泛化过程可能是什么样子的。)
重要的是,AGI的目标不是重现人类;例如,我们不希望AGI撒谎或患有精神疾病。相反,AGI的目标应该是构建能够可靠地推理和计划广泛世界的机器。人类有时会犯错误,有时是故意的,有时是无意的,这绝不会消除或修复当前方法的局限性。AI领域最终会做得更好,但可能是以一种结构不同的AI,其中事实是一等公民,而不是你希望通过足够的数据就能免费获得的东西。
TL;DR:如果你渴望AGI,不要通过制造表面上看起来像人类错误的东西来安慰自己。
大模型日报(4月22日 资讯篇)
大模型日报(4月22日 资讯篇)https://x.com/GaryMarcus/status/1782092855634526505
07

阿里巴巴发布gte-large-en-v1.5:新的SOTA Apache 2嵌入模型

阿里巴巴刚刚发布了一个新的SOTA Apache 2嵌入模型。4.34亿参数,57.91的MTEB检索分数,8192个token的上下文长度,transformer++编码器主干(BERT + RoPE + GLU)。

gte-large-en-v1.5
我们推出了gte-v1.5系列,这是升级版的gte嵌入模型,支持**最长8192**的上下文长度,同时进一步提升了模型性能。这些模型基于transformer++编码器**主干**(BERT + RoPE + GLU)构建。
gte-v1.5系列在相同模型大小类别的MTEB基准测试中取得了最先进的成绩,并在LoCo长上下文检索测试中表现出色(参考**评估**)。
我们还推出了gte-Qwen1.5-7B-instruct,这是一个SOTA指令调优的多语言嵌入模型,在MTEB中排名第二,在C-MTEB中排名第一。
大模型日报(4月22日 资讯篇)https://x.com/n0riskn0r3ward/status/1782060819485721029
08

Sakana AI发布使用其提出的进化模型合并方法构建的图像生成模型EvoSDXL-JP

Sakana AI发布了使用其提出的”**进化模型合并**”方法构建的图像生成模型”**EvoSDXL-JP**”。构建的模型支持日语,与传统的日语模型相比,可以以10倍的速度生成图像。
博客 ↓ 
https://sakana.ai/evosdxl-jp
演示 ↓
https://huggingface.co/spaces/SakanaAI/EvoSDXL-JP…
我们最近提出了一种使用进化算法构建基础模型的方法”进化模型合并”,同时发布了使用该方法试验构建的语言模型。这些模型是用于语言生成的自回归Transformer模型。这次,为了展示进化模型合并的更多可能性,我们将其应用于广泛用于图像生成任务的扩散模型。
构建的EvoSDXL-JP是通过融合不同的开放模型,支持日语并能生成日式风格图像的模型。与现有的日语模型相比,推理速度提高了10倍,同时生成图像的质量也得到了提升。EvoSDXL-JP模型已在HuggingFace上公开,供研究和教育使用。此外,我们还发布了一个现在就可以尝试的演示。请务必试一试。
模型 ↓
https://huggingface.co/SakanaAI/EvoSDXL-JP-v1…

大模型日报(4月22日 资讯篇)https://x.com/SakanaAILabs/status/1782207884170080407

资讯

01

黄仁勋对话 Cadence CEO:AI 将在数据中心、机器人/自动驾驶、生命科学三个领域带来革命性影响!

英伟达 CEO 黄仁勋(Jensen Huang)近日参加了 Cadence 举办的活动,对话 Cadence CEO Anirudh Devgan,讨论了 AI 与加速计算在塑造行业大趋势方面的关键作用,以及英伟达与 Cadence 如何合作推动 EDA、SDA、数字生物学和 AI 领域的转型变革。
大模型日报(4月22日 资讯篇)https://mp.weixin.qq.com/s/IozUKf0ydoH9JcJIz3Z6vw
02

古尔曼:苹果正自研设备端大型语言模型,赋能 AI 功能

苹果公司正在研发一种运行于设备端的大型语言模型 (LLM) ,旨在提升即将发布的生成式 AI 功能的响应速度和隐私保护能力。古尔曼在其“Power On”通讯中提到,苹果的这个 LLM 将成为该公司未来生成式人工智能功能的基础。与现今大多数云端人工智能服务不同的是,所有迹象都表明该模型将完全运行于用户设备之上。
大模型日报(4月22日 资讯篇)https://www.ithome.com/0/763/266.htm
03

阿里云宣布全方位支持Llama 3训练推理,并提供免费算力

近日,Meta开源最新Llama 3系列,阿里云魔搭社区第一时间上架全部4款模型。今天,阿里云百炼大模型服务平台宣布推出针对Llama 3系列的限时免费训练、部署、推理服务,企业和开发者即日起即可在阿里云上基于其打造自己的专属大模型。
大模型日报(4月22日 资讯篇)https://finance.sina.com.cn/tech/shenji/2024-04-22/doc-inassmqz1146978.shtml
04
4

智谱 AI 旗下 AMiner 开放数据平台发布《全球十个大模型核心团队成员分析报告》

智谱 AI 旗下 AMiner 开放数据平台发布了《全球十个大模型核心团队成员分析报告》,旨在为大模型领域的相关人员在今后的研究交流、人才引进提供参考。该报告结合当下模型知名度和专家建议选取了全球十个大模型(GPTGemini、Claude、GLM、LLaMA、Qwen、Falcon、PaLM、BERT、T5),从地域分布、年龄结构、教育背景、华人占比和学术影响力5个维度进行全面分析,揭示了十个大模型核心成员的人才现状。报告显示,华人在大模型领域具有一定竞争力,在挑选的国外(除 GLM、Qwen)大模型团队成员 899 人中,华人成员共计 167 位占比达18.7%。
大模型日报(4月22日 资讯篇)https://open.aminer.cn/open/article?id=6620fea7d9a27592a9337fd5
05

AI 将帕金森病药物设计提速十倍,可识别阻止该病症特征蛋白聚集小分子

据英国剑桥大学官网,该校研究人员通过人工智能技术大幅加快了帕金森病治疗方法的开发进程。研究人员设计并使用了一种基于 AI 的策略,从而来识别阻止 α-突触核蛋白(IT之家注:帕金森病的特征蛋白)聚集的小分子。这也是寻找帕金森病潜在治疗方法的一条途径。
大模型日报(4月22日 资讯篇)https://finance.sina.com.cn/tech/mobile/n/n/2024-04-22/doc-inassfia2228262.shtml
06

体外命中率提高75%,Model Medicines&加州大学开发AI驱动的药物发现框架

在不断发展的药物发现领域,传统方法由于效率低和资源需求高而面临重大挑战。AI 药物公司 Model Medicines 和加州大学圣地亚哥分校的研究人员开发了 GALILEO AI 药物发现平台及其核心模型 ChemPrint,旨在提高药物发现的效率。为了解决命中率低和探索新化学空间困难的挑战,该平台采用自适应分子嵌入和严格的模型训练环境来增强预测能力并导航未知的分子领域。在针对 AXL 和 BRD4 肿瘤学靶标的案例中,ChemPrint 实现了 45.5% 的体外命中率,并鉴定了 20 种新型作用化合物。这些化合物表现出巨大的化学新颖性,其训练集的平均 Tanimoto 相似度得分为 0.32。
大模型日报(4月22日 资讯篇)https://mp.weixin.qq.com/s/R4wWi3HbmPRHCZ61jHKr8A

产品

01

Stylar

Stylar 是一款不断革新创意过程的AI设计草图工具,能够将草图转化为精美的产品图片。其 AI 设计草图功能确保产品图像以卓越的清晰度和逼真度呈现。此外,Stylar提供多样的风格选项,让用户轻松尝试不同的美学,找到与其设计喜好相契合的完美外观。用户还可以利用增强的视觉效果生成多种展示产品的选项,例如在森林环境中突出展示跑鞋,或者在客厅环境中展示舒适的拖鞋,以吸引观众注意。
大模型日报(4月22日 资讯篇)https://www.stylar.ai/tools/ai-design-sketch
02

Univi

Univi 是一个旨在帮助多动症(ADHD)群体的社区平台,提供了一系列针对多动症个体的实用工具和资源,包括迷你课程、个性化冥想、待办事项清单、情绪跟踪、多动症测试等,也借助 AI 帮助用户进行定制化帮助,希望他们更好地应对日常挑战并获得支持。
大模型日报(4月22日 资讯篇)https://www.univi.app/
03

AllMind AI

AllMind AI 是用户的个人财务分析师,向用户提供集中、实时、可操作的见解。借助专有LLM(大型语言模型)AllMind AI,将研究时间缩短了90%,成本降低了98%。据称,在每一个财务任务中,都能胜过GPT-4、Gemini和Opus。
大模型日报(4月22日 资讯篇)https://allmindinvestments.com/
投融资
01

Xfactor.io完成1600万美元A轮融资

位于加利福尼亚州旧金山的Xfactor.io,一家提供全面AI驱动收益平台的公司,成功完成了1600万美元的A轮融资。本轮融资由Accel领投,Xfactor.io的首席执行官兼创始人Mike Carpenter和Lightspeed等参与投资。公司计划利用这笔资金进一步增强其产品,优先提升其AI能力,以赋能收入领导者优化其整个市场推广团队的规划和表现。
公司官网:https://www.xfactor.io/
大模型日报(4月22日 资讯篇)https://www.finsmes.com/2024/04/xfactor-io-closes-16m-series-a-funding.html
02

理光收购德国软件初创公司natif.ai,拓展高级AI技术

理光公司宣布收购德国软件初创企业natif.ai,该公司专注于提供启用人工智能的智能捕获、高级图像识别和光学字符识别(OCR)技术。此次收购将增强理光的流程自动化产品组合中的数据提取功能,覆盖纸质和手写文档等多种文件,旨在为客户在广泛的业务流程中提供自动化和精细化服务。此举是理光在流程自动化领域增长策略的一部分,通过整合DocuWare和natif.ai的智能索引技术,进一步提升AI驱动的捕获和自动化能力。
公司官网:https://natif.ai/
大模型日报(4月22日 资讯篇)https://www.ricoh.com/release/2024/0422_1
03

Aurionpro Solutions收购Arya.ai,为金融机构打造下一代企业AI平台

Aurionpro Solutions Limited宣布收购专注于银行和保险的PaaS初创公司Arya.ai。此次收购将通过Arya.ai的尖端AI云平台,强化Aurionpro在企业金融科技领域的产品组合,加速推动负责任、精确、可审计的AI技术的采纳。交易包括购买现有股东持有的股份和新的股本资本的认购,总投资约为1650万美元。此举旨在为全球金融机构创建领先的企业AI平台,提升客户价值。
公司官网:https://arya.ai/
大模型日报(4月22日 资讯篇)https://www.prnewswire.com/apac/news-releases/aurionpro-solutions-acquires-aryaai-to-power-next-generation-enterprise-ai-platforms-for-financial-institutions-302122931.html
04

斯堪的纳维亚法律科技初创公司Juristic筹集100万美元以利用AI赋能律师

Juristic,一家位于斯堪的纳维亚的法律科技初创公司,成功筹集了100万美元的投资。此轮投资由Ugly Duckling Ventures(此前投资Kollektive和BeCause)和丹麦律师及天使投资人Jonatan Hjortdal领投。其他投资者包括律师事务所合伙人、投资者及连续创业者Jens Bang Liebst。Juristic计划利用这笔资金加速其在斯堪的纳维亚及欧洲的增长和扩张计划,特别是在人工智能产品方面的增强。
公司官网:https://www.juristic.io/
大模型日报(4月22日 资讯篇)https://techfundingnews.com/scandinavian-legal-tech-startup-juristic-snaps-1m-to-empower-lawyers-with-ai/

大模型日报(4月22日 资讯篇)

大模型日报16

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/04/15864.html

Like (0)
Previous 2024-04-22 16:26
Next 2024-04-22 21:17

相关推荐