大模型日报(5月22日 资讯篇)

特别活动

大模型日报(5月22日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(5月22日 资讯篇)

资讯

01

微软颠覆生产力:Copilot推自定义版,AI PC原生支持PyTorch,奥特曼预告新模型

AI 生产力的未来会是什么样子?全世界都在等待微软的答案。5 月 22 日凌晨,微软 Build 2024 开发者大会在美国西雅图召开,今天的发布有关 AI 技术,更有关 AI 带来的新工具。「三十多年来,微软对于计算机一直有两个梦想 —— 首先是让计算机理解我们,而不是我们去理解计算机;其次,在信息不断增加的世界中,让计算机帮助我们根据信息有效地进行推理、计划和行动。人工智能浪潮已经为我们的梦想找到了答案,」微软 CEO 萨蒂亚・纳德拉说道。今天 Build 大会的内容主要最新的 Copilot,适用于生成式 AI 的新形态硬件,以及使用新 AI 能力的工具堆栈。
大模型日报(5月22日 资讯篇)https://mp.weixin.qq.com/s/Rm2MYC8dv6_Hnt68ktUV-w
02

Hinton万字访谈:用更大模型「预测下一个词」值得全力以赴

「这份访谈的每一秒都是精华。」最近,图灵奖得主 Geoffrey Hinton 的一个访谈视频得到了网友的高度评价。在访谈中,Hinton 谈到了很多话题,包括当前大模型的技术路线、多模态学习的重要性、 数字计算与共享知识、智能系统的意识与情感以及他的合作者和优秀学生……Hinton 认为,大型语言模型通过寻找不同领域的共同结构来进行编码,这种能力使它们能够压缩信息并形成深层次的理解,发现现实世界中人类尚未发现的万事万物的联系,这是创造力的来源。他还提到,通过预测下一个符号,模型实际上必须执行一定程度的推理,而不是像很多人所说的大模型并不具备推理能力。随着模型规模的增加,这种推理能力也将变得越来越强。这是一个值得全力以赴的方向。
大模型日报(5月22日 资讯篇)https://mp.weixin.qq.com/s/OydltjpVwsQ7hNBH6hq_Og
03

报道称可穿戴智能设备 Al Pin 的制造商 Humane 正在寻找买家出售

Humane 是可穿戴智能硬件 AlPin 背后的初创公司,该公司由苹果前长期员工 lmran Chaudhri 和 BethanyBongiorno 领导。据彭博社报道它已经在为其业务寻找潜在买家,寻求 7.5 亿至 10 亿美元的估值,而这距离发布Al Pin 才一个多月。
大模型日报(5月22日 资讯篇)https://www.theverge.com/2024/5/21/24162185/humane-seeking-acquisition-rumor-ai-pin
04
4

三维设计巨头 Autodesk 收购 AI 视效创企 Wonder Dynamics

Autodesk 宣布已收购 Wonder Dynamics,两家公司曾一直有密切合作。据悉 Wonder Dynamics 作为一家初创公司,旗下的 Wonder Studio 是一款融合云技术与人工智能(AI)的 3D 动画和视觉特效创作工具,并与 Autodesk Maya 等其他主流的 3D 设计工具高度兼容,帮助艺术家更轻松地在场景中制作 3D 角色动画、灯光和构图。
大模型日报(5月22日 资讯篇)https://www.ithome.com/0/769/807.htm
05

从Claude 3中提取数百万特征,首次详细理解大模型的「思维」

刚刚,Anthropic宣布在理解人工智能模型内部运作机制方面取得重大进展。Anthropic 已经确定了如何在 Claude Sonnet 中表征数百万个概念。这是对现代生产级大型语言模型的首次详细理解。这种可解释性将帮助我们提高人工智能模型的安全性,具有里程碑意义。
大模型日报(5月22日 资讯篇)https://mp.weixin.qq.com/s/cZhmvAva6NDLG84kD819Ww
06

简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024

近年来,「scaling」是计算机视觉研究的主角之一。随着模型尺寸和训练数据规模的增大、学习算法的进步以及正则化和数据增强等技术的广泛应用,通过大规模训练得到的视觉基础网络(如 ImageNet1K/22K 上训得的 Vision Transformer、MAE、DINOv2 等)已在视觉识别、目标检测、语义分割等诸多重要视觉任务上取得了令人惊艳的性能。然而,「scaling」往往会带来令人望而却步的高昂模型训练开销,显著阻碍了视觉基础模型的进一步发展和工业应用。面向解决这一问题,清华大学的研究团队提出了一种广义课程学习(generalized curriculum learning)算法:EfficientTrain++。其核心思想在于,将「筛选和使用由易到难的数据、逐步训练模型」的传统课程学习范式推广至「不进行数据维度的筛选,一直使用全部训练数据,但在训练过程中逐步揭示每个数据样本的由易到难的特征或模式(pattern)」。
大模型日报(5月22日 资讯篇)https://mp.weixin.qq.com/s/GsFXuNpZAF98bc7uMvOBCA

推特

01

Codium AI Cover Agent: 第一个改变自动测试生成的论文的开源实现

第一个改变自动测试生成的论文的开源实现现在可用!
今年二月,Meta发布了一篇论文,介绍了一种工具可以自动增加测试覆盖率,并保证对现有代码库进行改进。
这是一件大事,但Meta并没有发布代码。
幸运的是,我们现在有了Cover-Agent,一个你可以安装的开源工具,它实现了Meta的论文内容,可以自动生成单元测试:
https://github.com/Codium-ai/cover-agent
我录制了一个简短的视频,展示了Cover-Agent的实际应用。我想提两点:
  1. 自动生成单元测试并不是新鲜事,但要做好却很难。如果你让ChatGPT来做,你会得到重复的、不可运行的和无意义的测试,这些测试不会改进你的代码。而Meta的解决方案只生成唯一的、可运行的测试,并且增加代码覆盖率。
  2. 对于在写代码之前编写测试(TDD)的人来说,这可能不太有用。但这没关系,并不是每个人都做TDD,但我们都需要提高测试覆盖率。
AI有很多好与坏的应用,但这是一个我期待能融入我生活的应用。

大模型日报(5月22日 资讯篇)https://x.com/svpino/status/1792897013920538944

02

Anthropic最新研究论文:扩展单义性, 首次对现代生产级大型语言模型进行详细研究

Anthropic最新研究论文:扩展单义性。
首次对领先的大型语言模型进行了详细的内部研究。
在此阅读博客文章:http://anthropic.com/research/mapping-mind-language-model
今天,我们报告了在理解AI模型内部运作方面的重要进展。我们已经识别出数百万个概念在Claude Sonnet(我们部署的大型语言模型之一)内部的表示方式。这是首次对现代生产级大型语言模型进行详细研究。这一可解释性的发现将来可能有助于使AI模型更加安全。
我们通常将AI模型视为一个黑箱:输入某些内容,然后输出一个响应,但不清楚为什么模型给出了那个特定的响应而不是另一个。这使得我们很难相信这些模型是安全的:如果我们不知道它们如何工作,我们怎么知道它们不会给出有害的、偏见的、不真实的或其他危险的响应?我们如何能相信它们会安全可靠?
大模型日报(5月22日 资讯篇)https://x.com/AnthropicAI/status/1792935506587656625
03

Shawn Wang: AnthropicAI非常接近在可商品化的解释模型方面取得突破, 不要忽视他们的论文

在我看来,AnthropicAI非常接近在可商品化的可解释性方面取得突破。
在过去的四年里,我们用来真正控制大型语言模型(LLM)的工具主要是温度/Top_p和logit偏差。我们最近得到了seed和约束结构化输出,并且interactive=false也在实现中。
但现在Claude Sonnet可以让人们调节多达3400万个特征,这些特征涵盖了从著名人物和名词类别到抽象概念(例如保密能力、代码错误和自我表现)等各个方面。这是“大规模的表示工程”,并且可能很容易为你关心的任何特征集重新训练特征自动编码器(SAEs)。
不要忽视他们的论文。这是一系列突破性工作的成果。
大模型日报(5月22日 资讯篇)https://x.com/swyx/status/1793064538650325472
04
4

Deeplearning AI《设备端 AI 简介》:将 AI 模型部署到边缘设备

学习如何在我们的新短期课程《设备端 AI 简介》中将 AI 模型部署到边缘设备上,该课程由我们与 Qualcomm 合作创建,并由工程高级总监 Krishna Suresh 教授。
我认为设备端(边缘)AI 是一项重要的技术趋势,它支持新的低延迟、隐私保护应用。在本课程中,您将部署一个实时图像分割模型,并通过此过程学习设备端部署的关键步骤:神经网络图捕获、设备端编译、硬件加速以及设备端数值正确性的验证。您还将了解量化如何使您的模型速度提高至 4 倍、尺寸缩小至 4 倍,从而提升其在资源受限的边缘设备上的性能。
所涵盖的技术用于将模型部署到包括智能手机、无人机和机器人在内的多种设备类型上,从而实现许多新的、富有创意的应用。
请在此注册:https://deeplearning.ai/short-courses/introduction-to-on-device-ai/

大模型日报(5月22日 资讯篇)https://x.com/AndrewYNg/status/1792919935691214899

05

Phi-3 小型和中型模型现在已在 MIT 许可下发布

Phi-3 小型和中型模型现在已在 MIT 许可下发布!🚀 微软刚刚推出了 Phi-3 小型 (7B) 和中型 (14B) 模型 🤯。Phi-3 小型模型声称优于 Meta 的 Llama 3 和 MistralAI,而 Phi-3 中型模型则优于 GPT-3.5 和 Cohere Command R+ 🤔。
总结:
🧮 Phi-3 小型 7B 和 Phi-3 中型 14B 指导版本,支持最高 128k 上下文
🏆 Phi-3 小型 (7B): 在 MMLU 上得分 75.5;在 AGI 评估中得分 43.9(优于 Mistral 7B 或 Llama 3 8B)
🥇 Phi-3 中型 (14B): 在 MMLU 上得分 78.0;在 AGI 评估中得分 50.2(优于 Cohere Command R+ 或 GPT-3.5-Turbo)
🧠 训练数据包含 4.8 万亿个标记,包括合成和过滤后的公共数据集,并支持多语言(训练数据的 10%)
⚖️ 通过 SFT 和 DPO 微调
🔡 新的分词器,词汇量为 100,352
🔓 所有模型都在 MIT 许可下发布
🤗 在 Huggingface、Azure AI 和 ONNX 上可用
❌ 没有发布基础模型
❌ 没有关于数据集混合的详细信息(合成数据和网络数据的比例)
免责声明:模型训练可能涉及与基准数据类似的合成数据。我们需要进一步的评估或训练数据的详细信息。
大模型日报(5月22日 资讯篇)https://x.com/_philschmid/status/1792934321407369532
06

 Cover-Agent:开源工具,用于自动增强测试组

🚀 介绍 Cover-Agent 🧪
这是一款开源工具,包括对 Meta 的 TestGen-LLM 的重新实现,用于自动增强测试套件。
经理:“我们必须改进旧的测试组以提高代码覆盖率。你能处理吗?”
我:“当然,这是我最喜欢的任务……(并不是!)🤷♂️”
Meta 的团队想用 LLMs 来增强测试组——听起来很棒,对吧?但他们没有发布他们的代码。
我们发布了。
在我们改进这个基准的过程中,期待您的反馈。
在这段视频中,我将回顾 TestGen-LLM,分享见解,并向您介绍 Cover-Agent。

大模型日报(5月22日 资讯篇)https://x.com/itamar_mar/status/1792671154538152126

产品

01

Atlas.org

Atlas.org 是一款专门为学生设计的智能 AI 助手,旨在通过多方位的学习支持来帮助学生提高成绩,减轻学习压力。它能够针对各种学科领域提供作业辅导、学习指导、写作帮助、内容总结等功能,并基于学生的实际课程材料提供个性化的AI辅助。
大模型日报(5月22日 资讯篇)https://atlas.org/
02

Ragobble

Ragobble 是一款利用先进的人工智能算法来增强搜索功能的创新工具,它可以帮助用户更快速、准确地搜索到所需的视频、文件和网页链接等内容。该工具通过深度挖掘数据,提供更广泛的搜索范围,让用户能够发现传统搜索手段难以找到的信息。同时,Ragobble 也致力于优化搜索流程,给予用户更加友好、高效的在线导航体验。
大模型日报(5月22日 资讯篇)https://ragobble.com/

投融资

01

数据标注初创公司Scale AI融资10亿美元

Scale AI为希望训练机器学习模型的公司提供数据标注服务,近日宣布完成了10亿美元的F轮融资,投资方包括亚马逊和Meta等知名机构和公司。此次融资是主次结合,是AI领域大量巨型风险投资的最新案例之一。在此之前,Scale AI已经历了约8年的发展,此前共筹集了约6亿美元,包括2021年的3.25亿美元E轮融资,估值约为70亿美元。三年后,尽管去年裁员20%,但Scale AI的估值已经达到138亿美元。Accel领投了本轮融资,而Scale AI的现有投资者包括Nvidia、Y Combinator等也纷纷回归。该公司的客户包括微软、丰田、通用汽车、Meta和美国国防部等。Scale AI表示将利用新资金加速“铺设通向人工智能通用智能的道路的前沿数据的丰富性”。
公司官网:https://scale.com/
大模型日报(5月22日 资讯篇)https://scale.com/blog/scale-ai-series-f
02

法国AI初创公司H完成2.2亿美元种子轮融资

法国AI初创公司H(原名Holistic AI)在成立几个月后宣布完成了2.2亿美元的种子轮融资。该公司的创始团队包括前DeepMind的顶级研究人员,吸引了众多投资者。投资者名单包括亿万富翁Eric Schmidt、Xavier Niel和Bernard Arnault的Aglaé Ventures等,以及知名风投Accel、Bpifrance、Creandum等。H的目标是开发能够提高工作效率的前沿行动模型。融资中的40%为传统股权投资,其余部分将转为未来股权。
公司官网:https://www.hcompany.ai/
大模型日报(5月22日 资讯篇)https://techcrunch.com/2024/05/21/french-ai-startup-h-raises-220-million-seed-round/
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/05/15198.html

Like (0)
Previous 2024-05-21 19:39
Next 2024-05-22 23:59

相关推荐

  • 大模型日报(5月30日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-05-30
    195
  • 大模型日报(7月30日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-30
    234
  • 大模型日报(7月31日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-31
    221
  • 大模型日报(8月2日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-02
    248
  • 出门问问李志飞:大模型下半场,要找到自己的灵魂|Z Circle

    Z Circle是关于人的栏目。 人是一切创新的源动力。在过去的十二年里,真格一直专注投人,连接起最真挚、勇敢、极具创新精神的人们。我们记录他们的故事和旅程,希望与你相识,也期待你…

    2023-09-27
    345
  • 大模型日报(7月29日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-29
    236
  • 大模型日报(8月3~4日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-04
    197
  • 大模型日报(7月22日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-22
    233
  • 论文分析|高效长文本生成——让模型更高效、更智能!

    Preface 前言 目前大模型公司很多在追求长文本, 对算力需求极大,如何能够现实地处理该问题很重要。特别是随着Transformer模型尺寸和复杂性的增长,它们在训练期间的内存…

    2024-08-05
    408
  • 揭秘DriveLM:首个含图结构“语言+自动驾驶”全栈数据集

               1.首个含图结构的“语言+自动驾驶”全栈数据集               与传统自动驾驶领域数据集相比,DriveLM的突出特征在于,它是一个主要针对图像,…

    2024-05-28
    346