我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!

潜空间第六季活动开始报名!!

资讯
两位AI先驱因强化学习研究获图灵奖
安德鲁·G·巴尔托(Andrew G. Barto)和理查德·S·萨顿(Richard S. Sutton)因在强化学习领域的开创性工作荣获2024年图灵奖。强化学习是一种通过奖惩机制让机器在试错中学习并适应动态环境的技术。巴尔托是马萨诸塞大学阿默斯特分校的名誉教授,萨顿则是阿尔伯塔大学的教授。他们在1980年代发表了一系列开创性论文,提出了时间差学习(temporal difference learning)等强化学习的核心算法和理论,并共同出版了《强化学习:导论》一书。
图灵奖由计算机协会(ACM)颁发,被誉为“计算领域的诺贝尔奖”。近年来,强化学习受到越来越多关注,尤其是在谷歌DeepMind使用该技术打造的AI击败了世界顶尖的围棋选手AlphaGo之后。此外,中国的AI初创公司DeepSeek也通过强化学习开发了具有颠覆性的R1推理模型,为基础模型的成本效益提升提供了新的思路。
图灵奖的颁发体现了对强化学习领域的深远影响。计算机科学、神经科学和心理学等多个学科的研究为强化学习的发展提供了灵感,使其成为AI进步的基础之一。ACM会长扬尼斯·伊奥安尼迪斯(Yannis Ioannidis)表示,巴尔托和萨顿的研究不仅是AI发展的重要里程碑,强化学习仍然在继续成长,并对计算学科及其他领域具有巨大的潜力。
图灵奖历史上,许多AI先驱也曾获此殊荣,其中包括2018年获得奖项的Meta首席AI科学家扬·勒昆(Yann LeCun),他与杰夫·辛顿(Geoff Hinton)和约书亚·本吉奥(Yoshua Bengio)共同因深度神经网络的研究成果获得了图灵奖。

https://techcrunch.com/2025/03/05/ai-pioneers-scoop-turing-award-for-reinforcement-learning-work/
通义千问推理模型QwQ-32B,开源!
通义千问推理模型 QwQ-32B 是一款由通义云启(杭州)信息技术有限公司开发的开源大语言模型,于2025年3月6日宣布开源。该模型在数学推理、编程能力以及通用能力等多个基准测试中表现出色,尤其在数学能力的 AIME24 测评集和代码能力的 LiveCodeBench 测试中,其表现与 DeepSeek-R1 相当,远超 o1-mini 及其他同尺寸模型。在 LiveBench、IFEval 和 BFCL 等权威测试中,QwQ-32B 的得分也超越了 DeepSeek-R1。
技术细节方面,QwQ-32B 采用了两轮强化学习策略。第一阶段针对数学和编程任务进行强化学习,通过生成答案的正确性反馈数学问题,并利用代码执行服务器评估生成代码的成功与否来提供反馈。随着训练轮次的推进,模型在这两个领域的性能持续提升。第二阶段则增加了通用能力的强化学习,使用通用奖励模型和基于规则的验证器进行训练。结果显示,少量步骤的通用强化学习能够提升模型的其他通用能力,同时在数学和编程任务上的性能并未显著下降。
此外,QwQ-32B 集成了智能体 Agent 相关能力,能够在使用工具时进行批判性思考,并根据环境反馈调整推理过程。目前,该模型已在魔搭社区和 Hugging Face 开源,采用 Apache 2.0 开源协议,用户可以自由下载体验。

https://mp.weixin.qq.com/s/rRray6o0ZxXHG-t5R08F8A
ARM与马来西亚签署2.5亿美元芯片协议,推动本地芯片设计生态发展
ARM控股(ARM Holdings)近日宣布,与马来西亚政府签署了一项协议,旨在促进该国芯片设计生态系统的发展。根据协议,马来西亚将在未来10年内支付ARM 2.5亿美元,以购买ARM的芯片设计和技术,供当地制造商使用。具体而言,马来西亚将购买包括ARM七个芯片设计蓝图在内的知识产权。ARM表示,这一合作还将包括为马来西亚培训10,000名工程师,提升当地技术水平。
此次协议标志着马来西亚在全球芯片制造领域的进一步布局,尤其是在美国与中国的技术紧张局势中,越来越多的科技公司开始寻找多元化的芯片供应来源。ARM此举正是为了抓住这一市场机会,进一步扩大其在全球芯片设计领域的影响力。
马来西亚政府在过去一年内已加大了对芯片制造行业的投资力度。今年,马来西亚表示计划制造自有的图形处理单元(GPU),以满足日益增长的AI和数据中心需求。马来西亚政府还在2023年宣布,将为国家半导体战略(NSS)提供至少53亿美元的财政支持,并计划培训60,000名工程师,致力于提升本国的芯片制造基础设施,打造先进的芯片供应链,并吸引全球顶级客户。
马来西亚在芯片产业已有超过50年的历史,目前为全球约13%的芯片测试、组装和封装提供服务。1972年,英特尔在槟城设立了其美国之外的首个生产设施,投资1600万美元建设组装厂。2021年12月,英特尔宣布将投资超过70亿美元,在马来西亚建立芯片组装和测试工厂,并计划在马来西亚建设其最大规模的3D芯片封装设施。2023年,美国的GlobalFoundries公司在槟城开设了新的中心,荷兰的芯片设备制造商Neways也计划在马来西亚建立新工厂。
此外,包括谷歌、微软和英伟达等科技巨头自2023年以来已宣布在马来西亚投资数十亿美元,主要用于数据中心、AI开发项目和云服务建设。这些投资凸显了马来西亚在全球芯片产业中的重要地位及其在技术和制造领域的持续扩展。

https://techcrunch.com/2025/03/05/arm-to-sign-250m-chip-deal-with-malaysia/
推特
短课程:事件驱动的智能代理文档工作流
新短课程:《事件驱动的智能代理文档工作流》
事件驱动工作流是一种关键的设计模式,它允许多个任务(如 LLM 调用、工具使用等)以异步并行的方式执行,同时,某些步骤的完成会生成事件,从而触发其他任务的开始。在本课程中,我们与 @llama_index 以及 @seldo(开发者关系副总裁)合作,教你如何将这一技术应用于文档工作流。
填写复杂的表单通常既繁琐又耗时,还容易出错。而智能代理工作流可以实现自动化处理。本课程将教你如何使用事件驱动架构构建智能代理文档工作流。
在本课程中,你将设计一个事件驱动的智能代理工作流,让代理基于源文档的信息自动填写 PDF 表单。智能代理将利用 RAG(检索增强生成)方法,从源文档中检索相关数据,解析表单以识别所需字段,将空白字段转换为问题,并向 RAG 系统提交这些问题,以完成表单填写。此外,你将通过**人机交互(human-in-the-loop)**的方式,与智能代理协作,通过文本或语音提供反馈。
课程内容:
• 理解事件驱动工作流的基本概念。
• 构建 LlamaIndex 工作流,逐步提升复杂性,从分支逻辑、循环执行到并发处理。
• 通过解析源文档、将提取的信息加载到向量存储中,并在其上构建查询引擎,为智能代理配置 RAG 能力。
• 让智能代理解析表单结构,将表单内容转化为简单问题,并利用这些问题查询 RAG 管道以完成表单填写。
• 加入人机交互机制,在需要时让智能代理重新回答,以提高表单填写的准确性。
• 添加多模态能力,使智能代理能够处理语音反馈。
课程目标:
完成课程后,你将能够构建一个事件驱动的智能代理工作流,实现自动化表单填写,并通过人机交互提高表单填写的准确性。
📌 立即报名:课程链接

https://x.com/AndrewYNg/status/1897389514034688313
Spark-TTS:基于 LLM 的文本转语音模型,支持零样本语音克隆和精细化语音生成
🚀 全新发布在 HF(Hugging Face):Spark-TTS——基于 LLM 的文本转语音(TTS)模型,支持零样本语音克隆和精细化语音生成,全部在单个流中完成!
-
基于 Qwen2.5 构建
-
可直接通过文本控制音高、语速和说话风格

https://x.com/Tu7uruu/status/1897228937698402417
Santiago分享关于爆火Model Context Protocol:开放标准,用于连接 AI 与数据
Anthropic 的 MCP 简直是一件艺术品,它让 AI 代理的能力提升 100 倍。
MCP(Model Context Protocol) 是一种开放标准,用于连接 AI 与数据。相比于面对成千上万种不同的集成方式,MCP 提供了一种标准化的方法。
• 想让 AI 访问你的数据 → 运行 MCP 服务器
• 想让 AI 读取数据 → 构建 MCP 客户端
不过,MCP 规范仍然较新,目前支持 MCP 服务器的应用还不多,而且现有的 MCP 服务器功能有限。
现在最好的选择是 Composio-MCP,由 @composiohq 团队打造,它提供了 250+ 服务器 访问能力:
• 支持数百种应用
• 管理 MCP 集成的身份验证和授权
• 提供 20,000+ 可用于自动化的操作
• 可轻松与 Claude 和 Cursor 集成
简单示例:
你可以通过 Composio-MCP 将 Slack、GitHub 和 Linear 服务器添加到 Cursor。然后,你只需一句话就能让 Cursor 执行完整的任务流:
1. 查找 Linear 中优先级最高的任务
2. 处理该任务并完成修改
3. 在 GitHub 提交 Pull Request
4. 在 Slack 通知团队
这意味着 Cursor 不再只是一个代码工具,而是一个端到端的 AI 工作助手。
这可能会让 AI 代理真正迎来爆发式增长!
(而且,你再也不用自己手动配置和维护各种 API 集成,省去大量麻烦。)

https://x.com/svpino/status/1896991534421307570
GPT-4.5向Plus用户推出
成为 Plus 用户的好日子。
Plus 用户的更新将在 1-3 天内逐步推送,我们会在完全上线后通知你。
我们希望所有 GPT-4.5 用户都能获得较高的调用上限,但随着我们进一步了解该“庞大”模型的需求,调用限制可能会有所调整。

https://x.com/OpenAI/status/1897346510821711959
Faceless.so:全栈平台,打造无露脸频道
介绍 Faceless.so —— 全栈平台,助你打造无露脸频道💫
• 自动生成短视频,支持从博客、Subreddit 及自定义提示词提取内容
• 自动发布至 YouTube 和 TikTok,并可设定每日定时推送
现在是时候打造你的 垂直领域无露脸频道 组合了!💪

https://x.com/shivanshco/status/1897200512044511463
谷歌AI概览集成Gemini 2.0,推出AI Mode
🧵 搜索新更新:
📝 Gemini 2.0 现已集成至 AI 概览(AI Overviews),可帮助解答代码和高级数学等复杂问题。
🔓 无需登录即可访问 AI 概览。
🔍 高阶用户一直希望在更多搜索中获取 AI 生成的回答。因此,我们推出了 AI 模式(AI Mode)——搜索的新实验功能。你可以自由提问,获得 AI 生成的回答,并通过后续问题和推荐链接进一步探索。
✨ AI 模式 在 AI 概览 的基础上扩展了更强的推理、思考和多模态能力。我们正在为 Google One AI Premium 订阅用户以实验模式逐步推出,用户可选择加入 Labs 体验。

https://x.com/Google/status/1897332925382975619
产品
Quadratic AI 具备代码和连接功能的 AI 电子表格
Quadratic 是一款现代电子表格,内置原生 AI、代码功能和数据连接功能。你可以与数据进行对话,创建交互式图表,并在几秒钟内直接从浏览器中获取洞察,无需进行设置。
主要功能
-
数据交互:支持与数据对话,快速获取洞察。
-
代码与公式编写:AI 能自动编写代码和公式。
-
可视化创建:可创建交互式图表,便于直观展示数据。
-
数据连接:能在熟悉的界面中与数据库建立连接,方便数据调用和处理

https://www.quadratichq.com/ai?
投融资
Anna Patterson创办的Ceramic.ai致力于帮助企业更高效地构建AI模型
安娜·帕特森(Anna Patterson)是硅谷的知名创业者,曾创办过多个初创公司,包括搜索引擎Xift、Cuil和互联网档案馆Recall.archive.org,此外,她还曾担任谷歌工程副总裁,并创办了专注于AI的种子基金Gradient Ventures。近日,帕特森创办了她的最新公司——Ceramic.ai,旨在为企业提供更高效的基础AI训练基础设施,帮助企业使用更少的GPU训练大型语言模型(LLM),并实现更高的规模化。
Ceramic.ai的核心目标是让企业能够通过简化基础设施,快速扩展其AI模型。公司声称其模型可以处理长上下文,并兼容任何计算集群,目标是帮助企业实现100倍的规模扩展。帕特森表示,传统的LLM基础设施过于复杂且存在过多变量,难以在大规模企业中普及,而她的公司旨在解决这一问题。
在2024年初,帕特森与首席科学家汤姆·科斯特洛(Tom Costello)共同创立了Ceramic.ai,尽管公司目前仍处于隐秘阶段,但已经与AWS和Lambda等合作伙伴达成协议,虽然尚未开始盈利。帕特森表示,在专注于销售之前,她希望先建立客户信任和品牌知名度。Ceramic.ai最近成功完成了1200万美元的种子轮融资,由NEA(New Enterprise Associates)领投,IBM、三星Next和Earthshot Ventures也参与了此次融资。帕特森指出,NEA之所以成为领投方,是因为该公司的技术能力与Ceramic.ai的目标高度契合,融资将主要用于销售推广和持续研发。
对于已经经历过三次创业的帕特森而言,这次的创业有一些不同的感受。她提到,作为一名前风险投资者,她对创业的时间压力感受更加明显。与年轻时的轻松心态相比,经过多年投资经验后,她更倾向于尽早将产品推向市场,快速获得客户反馈并进行迭代,这也为她的创业带来了更多的紧迫感。
目前,Ceramic.ai并非唯一一家在加速基础模型构建方面寻找机会的公司。其最大的竞争对手之一是Together AI,后者已筹集超过5.3亿美元的风险资本。此外,MosiacML也在加速LLM构建领域进行布局,并在2023年以13亿美元被Databricks收购。
尽管市场竞争激烈,Ceramic.ai仍然面临着快速发展的挑战,但帕特森的经验和公司的创新技术使其在这一领域中具备了一定的潜力。

https://techcrunch.com/2025/03/05/anna-pattersons-ceramic-ai-looks-to-help-enterprises-build-models-faster-and-more-efficiently/
Quantexa融资1.75亿美元,估值26亿美元,扩展AI数据分析业务
Quantexa,英国初创公司,专注于利用人工智能和数据分析帮助企业打击洗钱和欺诈行为。最近,该公司成功融资1.75亿美元,进行F轮融资,融资后估值为26亿美元,较2023年的18亿美元大幅上升。此次融资由加拿大安大略教师退休基金下属的Teachers’ Venture Growth(TVG)主导,且包括之前的投资方British Patient Capital参与。至今,Quantexa的融资总额已接近5.5亿美元。
作为一家成立9年的初创公司,Quantexa的企业平台吸引了包括Prudential、Vodafone、HSBC、ABN-AMRO和Accenture等在内的大量企业客户,且其平台目前已有成千上万的用户。过去一年,公司许可证收入增长了40%,全球已设有16个办公室,员工人数约为800人。
随着企业和公共部门对人工智能服务的需求不断增加,Quantexa也将业务重心从反洗钱和欺诈检测扩展至帮助组织更好地管理和利用各种数据来构建和运行AI服务。该公司专注于帮助解决“数据问题”,即帮助企业识别和整理大量未结构化的数据,以便为AI应用提供可靠的基础。公司创始人兼CEO Vishal Marria指出,AI技术的成功依赖于对数据的正确处理和信任,Quantexa的技术正是为了满足这一需求。
此外,Quantexa还加强了与微软的合作,计划在微软Fabric数据分析平台上开发AI驱动的工作负载,并为美国中型银行构建反洗钱解决方案。公司还计划扩大在公共部门的业务,特别是在政府AI项目上,通过利用结构化和非结构化数据来开发AI服务。
此次融资为Quantexa的未来发展提供了资金支持,特别是在AI需求快速增长的背景下,公司希望在扩大反洗钱业务的同时,进一步拓展到更多AI项目中。

https://techcrunch.com/2025/03/04/quantexa-nabs-175m-at-a-2-6b-valuation-to-double-down-on-data-analytics-for-ai/
EcoDataCenter融资4.78亿美元,推动可持续AI数据中心建设
瑞典公司EcoDataCenter(EDC)专注于构建环保型数据中心,已成功融资4.78亿美元(约合4.5亿欧元),以应对日益增长的需求。此次融资来自一群未透露名称的机构投资者,将用于开发新技术,建设更多绿色数据中心。此消息发布两天后,EDC的主要客户之一,AI计算巨头CoreWeave在美国提交了IPO申请。
至今,EcoDataCenter共筹集了9.1亿欧元(约9.66亿美元)的股权融资,尽管母公司Areim没有透露EDC的估值,但明确表示不会将其拆分或上市。EDC的投资经理Robert Björk表示,公司专注于扩大规模并创造长期价值,并表示尽管会不断评估未来的融资机会,但目前并不考虑进行IPO。
EcoDataCenter的目标是构建更加可持续的联合托管数据中心,特别是在AI计算需求激增的背景下,其努力显得尤为重要。国际能源署(IEA)指出,大型数据中心的电力需求非常庞大,甚至相当于约35万到40万辆电动汽车的年度用电量,占全球电力消费的1%。因此,EDC致力于在满足计算需求的同时,以环保方式进行建设,这一做法已经影响到其他企业。EDC是全球首家采用交叉层压木材(CLT)建造数据中心的公司,微软也开始跟随其步伐。
此外,EDC还采用可再生能源为其数据中心供电,并持续研究新材料和更高效的冷却技术,以提高运营效率。公司的客户包括DeepL和多家超大规模云计算公司,后者不仅自行建设数据中心,也会选择第三方数据中心,EDC便是其中的一个重要合作伙伴。EDC还与CoreWeave和Nvidia合作,在瑞典法伦市建设欧洲首个Blackwell集群,旨在为欧洲带来更多的计算能力。
此次融资反映了数据中心,尤其是联合托管型数据中心,在AI热潮中的重要性和巨大的市场需求。随着全球范围内对AI计算的需求飙升,数据中心建设正成为技术基础设施中的重要组成部分,吸引了大量基础设施资本流入这一领域。

https://techcrunch.com/2025/03/04/coreweave-partner-ecodatacenter-racks-up-half-a-billion-dollars-to-build-more-sustainable-buildings-for-ai/
— END —
2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切
3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话
快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/03/43257.html