大模型日报(2月25日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息


如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。


大模型日报(2月25日 资讯篇)


潜空间第季活动开始报名!!
【第 1 期嘉宾介绍】张月光——沐言智语创始人、产品经理,目前聚焦在 AI ToC 产品的创新探索。5 年阿里工作经验,从 0 到 1 创办妙鸭相机,还曾经从 0 到 1 打造二次元换装语音社交产品“元音”。本次张月光将带来《 AI 应用探索的一些实践》的分享。
大模型日报(2月25日 资讯篇)

资讯

01


Claude 3.7 Sonnet来袭,真实编码力压对手


2025年2月25日,Anthropic发布了Claude 3.7 Sonnet,这是全球首个混合推理模型,兼具普通LLM和推理模型的能力,用户可根据需求选择标准或扩展思考模式。该模型在编码能力上表现出色,是Anthropic迄今为止最好的编码模型。Claude 3.7 Sonnet在SWE-bench Verified和TAU-bench等基准测试中表现优异,远超前代和其他竞争对手。此外,Anthropic还推出了Claude Code,一款有限的研究预览版本的智能编码工具,可帮助开发者在终端完成大量工程任务,如搜索代码、编写测试、提交代码等,显著减少开发时间和成本。Claude 3.7 Sonnet通过广泛测试,增强了对有害请求的区分能力,减少了不必要的拒绝。Anthropic计划在未来几年内进一步提升Claude的能力,使其能够独立工作数小时甚至解决复杂难题。


大模型日报(2月25日 资讯篇)
https://mp.weixin.qq.com/s/RzdrxKbHKKqtN-FvbOQsZw



02

DeepSeek开源MoE训练、推理EP通信库DeepEP


2025年2月25日,DeepSeek在其开源周的第二天开源了DeepEP,这是一个专为混合专家系统(MoE)和专家并行(EP)定制的通信库。DeepEP旨在解决MoE模型在分布式训练和推理中面临的通信瓶颈问题,特别是在专家并行中负载不均衡的挑战。该库具备高效优化的All-to-All通信能力,支持NVLink和RDMA的节点内/跨节点通信,能够实现高吞吐量的训练及推理预填充计算核心和低延迟的推理解码计算核心。此外,DeepEP原生支持FP8数据分发,可灵活控制GPU资源,实现计算与通信的高效重叠。

DeepEP的性能表现令人瞩目。在H800 GPU上,结合NVLink和RDMA的常规内核测试中,DeepEP展现了出色的吞吐量表现。在低延迟内核测试中,针对推理解码阶段,DeepEP通过纯RDMA实现了极低的延迟。为了追求极致性能,DeepSeek在开发中使用了一个未公开的PTX指令,虽然可能在某些平台上导致未定义行为,但在Hopper架构上经过测试可确保正确性且性能大幅提升。DeepSeek建议用户在自己的集群上运行测试并使用自动调优配置以获得最佳性能。

开源DeepEP是DeepSeek在AI基础设施领域的又一重要创新,展示了其在提升MoE模型训练效率和降低成本方面的技术实力。这一举措也回应了此前对其技术创新能力的质疑,证明了DeepSeek在推动AI基础设施发展方面的决心和能力。DeepEP的开源为MoE模型的高效通信和并行处理提供了新的解决方案,受到了社区的高度关注和好评。


大模型日报(2月25日 资讯篇)

https://mp.weixin.qq.com/s/2V_mWRWupuYTosAHLAq4dg



03
元资助

智元推出AgiBot Digital World大型机器人仿真框架


智元机器人于2025年2月25日推出了AgiBot Digital World,这是一款专注于机器人操作技能研究与应用的大型仿真框架。它集成了海量逼真三维资产、多样化专家轨迹生成机制和全面的模型评估工具,能够高保真地模拟训练场景并全链路自动化生成数据,为机器人提供具身仿真服务。该框架拥有大规模、高精度的三维资产库,涵盖丰富多样的物体、场景和机器人模型,通过人工精细建模、三维重建技术和生成式人工智能等途径转化而来,具备极高真实性和多样性。基于NVIDIA Isaac-Sim开发的AgiBot Digital World,提供高度逼真的视觉渲染和精确的物理模拟,感知与交互细节极为真实。它还引入多模态大模型,支持自动生成操作任务和场景,可根据实际需求灵活创建多样化、复杂度可调的仿真任务与环境,实现数据闭环。

AgiBot Digital World致力于全链路自动化数据生产,其具身智能数据生成引擎提供真机操作数字孪生、具身智能体自动生成和仿真遥操作等多种专家轨迹生成策略,并结合域随机化和数据增强技术生成多样、鲁棒的专家轨迹数据,提升模型泛化能力。仿真过程中,可进行丰富的环境光照、物体材质、物理属性域随机化,支持多种操作轨迹增强方式,生成涵盖各类分布外情形的增强数据,实现数据分布的实时监测和控制。该引擎支持多模态数据生成,包括多视角RGB-D图像、触觉信息、机器人状态信息等,用于策略学习。依托自动化任务和场景生成机制,可快速构建大规模、可扩展的机器人操作专家轨迹数据,与真实机器人操作轨迹数据互补,降低数据成本。

智元机器人开源了AgiBot Digital World Dataset,涵盖5大类场景(家居、商超、办公、餐饮和工业)、180+品类具体物品、9种常见材质、12种核心技能,具有质量高、泛化快、任务多样、应用灵活的特点。这些数据为各类场景应用提供了坚实的开发基础和广泛的应用可能性,助力实现多技能训练和多任务泛化执行。未来,AgiBot Digital World还将进一步开放扩展,适配更多机器人本体和执行器,融合更多模态,如深度噪声传感器仿真、触觉传感仿真等,以加快具身智能的发展。

大模型日报(2月25日 资讯篇)

https://mp.weixin.qq.com/s/wj0Pb5g20fvILOxJz95LBg



04

阿里开源推理模型QwQ


2025年2月25日,阿里通义千问团队推出了QwQ-Max-Preview深度思考模型,这是一款支持联网搜索的推理模型,展现出强大的通用能力。它可以进行创意写作、代码生成、数学计算,甚至开发游戏等复杂任务。该模型基于Qwen2.5-Max构建,能力在数学、编程和通用任务中表现突出,同时在Agent相关工作流中也有良好表现。目前,QwQ-Max-Preview已上线通义千问官网,用户可通过点击“深度思考(QwQ)”按钮体验。团队计划不久后以Apache 2.0许可协议开源QwQ-Max及Qwen2.5-Max,并推出适合端侧的小尺寸推理模型。

在实测中,QwQ-Max-Preview表现出了强大的功能。例如,它能够联网搜索并结合实时信息对电影《哪吒2》进行评价,还能根据提示词生成代码和游戏。然而,由于目前是预览版,模型在某些任务上的表现还不够稳定,例如在代码生成和游戏开发任务中,实际效果与预期存在一定偏差。尽管如此,QwQ-Max-Preview的发布和即将开源的计划,显示出阿里在推理模型领域的积极布局。

此外,QwQ-Max-Preview还融入了Agent能力,支持工具选择,但目前体验版本尚未开放。团队表示,开源的满血版和轻量级变体将满足不同层次用户的需求,并邀请全球开发者社群进行实验、优化和扩展,探索从教育工具到Agent等多样化应用场景。阿里Qwen系列模型作为全球影响力最大的开源模型家族之一,衍生模型数量已超9万个,霸榜Hugging Face开源榜单全球前10名。QwQ-Max的开源将进一步推动全球开发者社区的发展。


大模型日报(2月25日 资讯篇)
https://mp.weixin.qq.com/s/y_RzOFoutZ5XyAwxVSqJSg


05

苹果承诺向美国制造业投入5000亿美元,包括在休斯顿新建人工智能服务器工厂


美国政府正在大力推动科技公司在本国加大投资,苹果公司于2月23日宣布了其未来四年在美国的5000亿美元投资计划,涵盖高端制造、工程和教育等领域,重点包括人工智能和芯片制造。苹果将在德克萨斯州休斯顿新建一家工厂,用于生产支持苹果人工智能项目“Apple Intelligence”的服务器,并将美国先进制造基金规模翻倍至100亿美元,同时在密歇根州新建一所学院,培训下一代工厂所需人才。此外,苹果还计划扩大研发投资。

苹果目前在美国拥有24家芯片制造工厂,分布于12个州,全球员工总数为16.4万人。公司计划未来四年再招聘2万人,但未明确这些岗位是否位于美国。此次投资计划显示苹果对美国经济的支持,尤其是在减少对美国以外制造业生态系统的依赖方面。苹果强调,其人工智能服务器工厂将专注于生产能够处理人工智能计算的机器,相关基金和培训预算也将重点支持人工智能硬件的制造。

苹果CEO蒂姆·库克表示:“我们对美国创新的未来充满信心,并且为通过5000亿美元承诺进一步扩大在美国的投资而感到自豪。”苹果计划在休斯顿新建的AI服务器制造工厂面积达25万平方英尺,预计2026年完工,这标志着苹果对人工智能在产品和服务中应用的重视。此外,苹果还计划扩大其在北卡罗来纳、爱荷华、俄勒冈、亚利桑那和内华达的数据中心服务器容量。

苹果的先进制造基金将用于支持合作伙伴的扩张,包括对台积电亚利桑那州Fab 21工厂的“数十亿美元承诺”,苹果是该工厂的最大客户。苹果尚未明确其教育计划的具体投入,但计划在底特律新建苹果制造学院,与密歇根州立大学等顶尖大学专家合作,帮助中小企业实施人工智能和智能制造技术。

大模型日报(2月25日 资讯篇)
https://techcrunch.com/2025/02/24/apple-commits-500b-to-us-manufacturing-including-a-new-ai-server-facility-in-houston/


推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Perplexity宣布Comet即将上线:智能搜索浏览器


Comet:Perplexity 推出的智能搜索浏览器

即将上线。

大模型日报(2月25日 资讯篇)

https://x.com/perplexity_ai/status/1894068197936304296




02 

Kaiber AI 发布 Film Superstudio Pro:基于节点的画布,可以在同一页面上生成分镜、视频、语音、音效等


哇……这个新的 AI 太厉害了。

Kaiber AI 刚刚发布了 Film Superstudio Pro,一个基于节点的画布,可以在同一页面上生成分镜、视频、语音、音效(MMAudio),甚至……

训练角色、物品、场景和风格

大模型日报(2月25日 资讯篇)

https://x.com/EHuanglu/status/1893664056986226703


03


Luma AI:视频转音频功能现已上线 DreamMachine


视频转音频功能现已上线 #DreamMachine!

要为你的视频生成音效,只需点击全新的 “音频” 按钮。你可以一键生成,或使用提示词进行更个性化的定制。

音频功能现已进入 Beta 测试阶段,所有用户可免费使用!


大模型日报(2月25日 资讯篇)

https://x.com/LumaLabsAI/status/1894063350666957148



04


英伟达推出DeepSeek-R1 针对 Blackwell 的优化,25 倍收入增长,单 token 成本降低 20 倍


推出 DeepSeek-R1 针对 Blackwell 的优化,相比四周前的 NVIDIA H100,实现 25 倍收入增长,单 token 成本降低 20 倍。

借助 TensorRT DeepSeek 对 Blackwell 架构的优化,包括 FP4 计算性能,同时保持最先进的生产级准确性,该模型在 MMLU 通用智能基准测试中达到 FP8 的 99.8%。

FP4 优化版 DeepSeek 检查点现已上线

@huggingface: https://huggingface.co/nvidia/DeepSeek-R1-FP4

大模型日报(2月25日 资讯篇)

https://x.com/NVIDIAAIDev/status/1894172956726890623



05


对话分支功能现已在 Google AI Studio 上线


对话分支功能现已在 Google AI Studio 上线!

探索 Gemini 模型的强大能力,在对话变得有趣时创建分支,然后随时回到主对话继续工作。

开启「云端访问 + 自动保存」(在设置中),立即体验!


大模型日报(2月25日 资讯篇)

https://x.com/OfficialLoganK/status/1894049802557456669




产品

01


Captivate 实时销售平台


Captivate 是一款实时销售平台,致力于优化企业与网站访客的互动体验。它能提供访客数据,便于企业识别潜在买家,并支持在网站上与访客即时进行视频通话,减少沟通阻碍。

该平台源于解决手动安排会议的繁琐问题,可助力 SaaS 等各类企业快速与合格潜在客户开启演示通话,无需表单和漫长等待。

大模型日报(2月25日 资讯篇)
  1. 访客数据洞察:Captivate 可获取大量网站访客数据,帮助企业判断访客是否为理想客户群体(ICP),为销售决策提供依据。

  2. 即时互动沟通:一旦识别出潜在买家,企业能立即在网站上与访客进行真人视频通话,区别于单纯依靠表单或聊天机器人的交流方式,抓住销售时机。

  3. 简化销售流程:优化销售过程,无论是新客户产品演示预约,还是跟进电话安排,都更加顺畅快捷,减少不必要的来回沟通。

  4. 降低沟通摩擦:以 SaaS 公司为例,能让产品演示通话在访客访问网站时即刻进行,一键开启贴合买家购买旅程的视频沟通,提升销售效率。

  5. 适配多行业场景:适用于科技初创企业、咨询公司、企业销售团队等多行业,助力不同类型的用户加速销售周期,且融入工作流程自然,不造成干扰

https://www.captiwate.com/





投融资

01

Patlytics完成1400万美元A轮融资,加速AI专利分析平台发展


纽约初创公司 Patlytics 近日宣布完成了一轮 1400 万美元的 A 轮融资,由 Next47 领投,谷歌的 Gradient Ventures、8VC、Alumni Ventures、Liquid 2 Ventures 和 Myriad Venture Partners 等现有投资者参与。此次融资完成后,Patlytics 的总融资额达到 2100 万美元。该公司计划利用这笔资金扩大销售团队、招聘更多工程师,并进一步开发其专利分析平台的功能模块。

Patlytics 由前风险投资家 Paul Lee 和连续创业者 Arthur Jen 于 2024 年 1 月创立,旨在通过 AI 技术优化企业、知识产权专业人士和律师事务所的专利工作流程。其平台利用定制的大型语言模型(LLMs)和生成式 AI 引擎,提供从专利申请起草、发明披露、无效性分析到侵权检测等一系列服务。

在过去六个月内,Patlytics 实现了显著增长,收入增长 20 倍,客户群扩大 18 倍,月增长率保持在 300%。其客户群体中约 50% 为律师事务所,另一半来自半导体、生物和制药等行业的企业。公司还计划进一步拓展国际市场,目前已在韩国、日本以及伦敦和德国推出试点产品。

此外,拥有超过十年知识产权诉讼经验的 Eric Lin 将加入 Patlytics 领导团队,担任战略副总裁,助力公司下一阶段的发展。

大模型日报(2月25日 资讯篇)


https://techcrunch.com/2025/02/24/patlytics-raises-14m-series-a-funding-for-its-patent-analytics-platform/



02

Anthropic新一轮融资增至35亿美元,估值达615亿美元


据《华尔街日报》报道,人工智能公司Anthropic正在敲定一笔35亿美元的融资,公司估值提升至615亿美元。此前,Anthropic计划融资20亿美元,但投资者对公司的兴趣推动了融资规模的扩大。此轮融资的参与者包括Lightspeed Venture Partners、General Catalyst、Bessemer Venture Partners以及阿布扎比投资公司MGX。如果顺利完成,Anthropic的总融资额将达到约180亿美元。

Anthropic由OpenAI前核心成员创立,主打产品为AI聊天机器人Claude。该公司本周发布了新的旗舰AI模型Claude 3.7 Sonnet。尽管其年化收入已达到约12亿美元,但公司目前仍处于亏损状态。Anthropic计划将新融资用于开发更强大的AI技术,以提升其在市场中的竞争力。


大模型日报(2月25日 资讯篇)
https://techcrunch.com/2025/02/24/anthropic-reportedly-ups-its-next-funding-round-to-3-5b/


推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话


快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/43108.html

Like (0)
Previous 2025-02-25 05:59
Next 2025-02-25 18:27

相关推荐