Apple 苹果公司最新推出系列高效开源的语言模型OpenELM,包括OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模的版本(分为预训练版和指令微调版共计八个模型)。OpenELM的代码、预训练模型权重以及训练和评估流程全部开放。此外,苹果还发布了将模型转换为 MLX 库的代码,从而在苹果设备上进行推理和微调。https://huggingface.co/apple/OpenELM05
Yi Tay:不对,特别是在语言方面。如果你训练一个没有自注意力机制的大型深度MLP语言模型,不管你喂给它多少数据,它的表现都会比Transformer差(即使Transformer用的数据更少)。它能达到同样的水平吗?我认为不能。在原始的MLP中,你的token甚至无法相互看到对方。另一方面,对Transformer的微小调整可能没有数据/计算那么重要。当然,说”架构研究”无关紧要、”没有区别”也不太准确。我经常听到人们用这个来为不在架构层面创新辩护。事实是,社区是站在巨人的肩膀上,巨人们做了所有的架构研究,将Transformer推进到了今天的状态。架构研究很重要。现在很多人只是认为这是理所当然的。Yao Fu:非常赞同。我的直觉是,FFN是用来存储知识的(这就是为什么大多数知识编辑都在FFN上),而注意力是用来实现算法的(这就是为什么大多数机制解释性,例如归纳头,都在注意力上)。此外,注意力似乎能实现的算法范围是其他替代方案的超集:当数据量很大时,一个可以由备选方式(如SSM)实现的算法,也可以由注意力来实现。https://x.com/Francis_YAO_/status/178328738559944310202
Eric Schmidt 支持的 Augment 作为 GitHub Copilot 的竞争对手,以 2.52 亿美元的资金悄然推出
人工智能正在为编码提供强大动力,开发人员也在接受它。在最近的 StackOverflow 调查中,44% 的软件工程师表示他们现在在开发过程中使用 AI 工具,26% 的人计划很快使用。Gartner 估计,目前有一半以上的组织正在试点或已经部署了 AI 驱动的编码助手,到 2028 年,75% 的开发人员将以某种形式使用编码助手。前微软软件开发人员 Igor Ostrovsky 认为,很快就不会有开发人员在工作流程中不使用 AI 了。”软件工程仍然是一项艰难且通常令人乏味和沮丧的工作,尤其是在大规模情况下,”他告诉 TechCrunch。”AI 可以提高软件质量、团队生产力,并帮助恢复编程的乐趣。”因此,Ostrovsky 决定构建他自己想要使用的 AI 驱动的编码平台。这个平台就是 Augment,周三它以 2.52 亿美元的资金从隐形模式中脱颖而出,估值接近独角兽(9.77亿美元)。在前谷歌 CEO Eric Schmidt 以及 Index Ventures、Sutter Hill Ventures、Lightspeed Venture Partners、Innovation Endeavors 和 Meritech Capital 等风投的投资下,Augment 旨在撼动仍处于萌芽状态的生成式 AI 编码技术市场。https://techcrunch.com/2024/04/24/eric-schmidt-backed-augment-a-github-copilot-rival-launches-out-of-stealth-with-252m/
产品
01
LangWatch
LangWatch.ai 旨在优化 GenAI 产品性能,减轻 AI 风险。他们的目标是通过洞察力支持决策,减轻安全风险,了解机器人产生幻觉的地方,并提高质量,以及保护产品免受越狱等恶意行为的侵害。https://langwatch.ai/02
MarketerGrad
MarketerGrad 旨在帮助公司与经验丰富的营销和设计专业人士建立联系。他们的目标是连接那些不需要全职营销,设计帮助的公司,同时也没有时间不断地外包零散的项目工作。该平台建立了一个 AI 系统,可以在 30 秒内帮助公司了解专业人才,并最终安排通话。据称,已经有大约 100 家公司使用了这个平台。https://marketergrad.com/投融资01
Nvidia 以7亿美元收购 AI 工作负载管理初创公司 Run:ai
Nvidia 收购了以色列特拉维夫的 AI 工作负载管理公司 Run:ai,交易金额据称为7亿美元。Run:ai 成立于几年前,已成功吸引包括 Insight Partners、Tiger Global 在内的风险投资。此次并购后,Nvidia 将继续提供 Run:ai 的产品,并将其整合进 Nvidia 的 DGX Cloud AI 平台,以优化和管理 AI 硬件基础设施。此交易是 Nvidia 自2019年以69亿美元收购 Mellanox 以来的最大收购之一。公司官网:https://www.run.ai/
Nvidia 宣布将收购以色列深度学习开发商 Deci AI,该公司开发了压缩生成 AI 语言模型的技术。此次收购紧随 Nvidia 昨日宣布与以色列 AI 基础设施协调和管理公司 Run:ai 达成最终协议,收购金额预计为6.8亿美元。Deci AI 成立四年来,已从包括 Emerge 和 Insight Partners 在内的投资者处筹集了5500万美元。公司计划利用其技术帮助客户更有效地在 Nvidia 服务器上运行 AI 语言模型,提高每个服务器的工作效率。公司官网:https://deci.ai/https://en.globes.co.il/en/article-nvidia-to-buy-israeli-deep-learning-co-deci-ai-report-100147741903
Parloa,一款面向客户服务的对话AI平台,融资6600万美元
Parloa,一家专注于客户服务的对话AI平台,成功完成了6600万美元的B轮融资,由 Altimeter Capital 领投。这轮融资紧随其去年完成的2100万美元融资。Parloa 创立于2018年,致力于通过自动化改善效率,已与欧洲保险巨头 Swiss Life 和体育用品零售商 Decathlon 等知名客户合作。此次融资将用于加强其在欧洲和美国的业务扩张。总投资至今已达9800万美元。公司官网:https://www.parloa.com/
FlexAI 是一家位于巴黎的初创公司,专注于为开发者提供更便捷的 AI 应用构建和训练计算资源。公司刚结束隐藏阶段,宣布成功筹集了2850万欧元(约3000万美元)的资金。这次融资由 Alpha Intelligence Capital (AIC)、Elaia Partners 和 Heartcore Capital 领投,Frst Capital、Motier Ventures、Partech 以及 InstaDeep 的 CEO Karim Beguir 参投。FlexAI 计划利用这笔资金推出其首个产品:一个按需云服务,旨在简化 AI 训练过程。公司官网:https://www.flex.ai/