我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!

潜空间第六季活动开始报名!!

资讯
亚马逊成立新团队开发代理型AI,瞄准下一个亿万级市场
据路透社报道,亚马逊在AWS内成立了一个新团队,专注于开发代理型AI系统,这些系统旨在帮助人们自动化生活中的各类任务。AWS CEO Matt Garman在一封发给员工的邮件中表示,代理型AI可能成为AWS下一个数十亿级别的业务。该团队将由曾领导亚马逊AI与数据团队的Swami Sivasubramanian负责。
亚马逊此举标志着其加入了科技行业向代理型AI转型的潮流。代理型AI是一种能够代替人类执行特定任务的智能系统。上周,亚马逊展示了将应用于更新版Alexa+的代理型AI功能,Alexa+能自动预约Uber、浏览网站并完成其他通常由人类完成的任务。
此外,AWS还可能致力于开发面向企业的代理型AI,与Salesforce和微软竞争,打造能够为企业客户自动化工作任务的智能系统。

https://techcrunch.com/2025/03/04/amazon-reportedly-forms-a-new-agentic-ai-group/
Cohere发布Aya Vision AI模型,声称领先行业
AI初创公司Cohere本周发布了其多模态“开放”AI模型Aya Vision,并声称其在多个方面属于行业领先水平。Aya Vision能够执行包括图像标题生成、回答照片相关问题、文本翻译和生成摘要等任务,支持23种主要语言。Cohere表示,Aya Vision是“让技术突破面向全球研究人员的重大一步”,并通过WhatsApp向公众免费开放。
Cohere在博客中提到,尽管AI技术取得了显著进展,但在多语言处理和跨模态任务(涉及文本和图像)上的表现仍存在巨大差距,Aya Vision的目标就是缩小这一差距。Aya Vision提供了两种版本:Aya Vision 32B和Aya Vision 8B。更为复杂的Aya Vision 32B在某些视觉理解基准测试中超越了包括Meta的Llama-3.2 90B Vision在内的2倍规模的模型,而Aya Vision 8B则在某些评估中超过了10倍于其规模的模型。
这两个模型已通过AI开发平台Hugging Face公开,并以创意共享4.0许可协议提供,但不允许用于商业用途。Cohere表示,Aya Vision的训练数据来自多种英文数据集,并通过翻译和生成合成注释来训练模型。合成注释即由AI生成的标签,用于帮助模型理解和处理数据。
Cohere的这一合成注释方法在行业内逐渐流行,尽管存在一定争议,OpenAI等竞争对手也在越来越多地使用合成数据进行训练。据Gartner研究公司估计,去年用于AI和分析项目的60%的数据是合成创建的。Cohere称,通过使用合成注释,Aya Vision的训练实现了高效且竞争力强的表现,消耗了较少的资源。
此外,Cohere还发布了新的基准套件AyaVisionBench,旨在评估模型在“视觉-语言”任务中的表现,如识别两幅图像之间的差异、将截图转化为代码等。Cohere指出,当前AI行业面临“评估危机”,即基准测试的综合评分与AI用户关心的任务能力关联较差。Cohere认为,AyaVisionBench为跨语言和多模态理解的评估提供了一个“广泛且具有挑战性”的框架。
Cohere的研究人员表示,AyaVisionBench是推动多语言多模态评估的重要一步,旨在为研究社区提供强有力的评估工具,推动该领域的进步。

https://techcrunch.com/2025/03/04/cohere-claims-its-new-aya-vision-ai-model-is-best-in-class/
OpenAI推出5000万美元资助计划,支持学术研究
OpenAI近日宣布,支持一个名为NextGenAI的新联盟,旨在推动顶级大学的AI辅助研究。该联盟的15个创始学术合作伙伴包括哈佛大学、牛津大学和麻省理工学院(MIT)。OpenAI将为该项目提供5000万美元的研究资助、计算资源和API访问权限,旨在为学生、教育工作者和研究人员提供奖学金,这些资助将在未来几个月内发放。
OpenAI表示,NextGenAI不仅旨在推动下一代科学发现,还希望为未来塑造AI的年轻一代做准备。该联盟将支持寻找治疗方法的科学家、揭示新见解的学者,以及掌握AI的学生。OpenAI在博客中提到,随着该计划的推进,公司将探索扩大其影响力和范围的机会。
NextGenAI的推出,标志着OpenAI在教育领域的进一步承诺,紧随去年5月推出的ChatGPT Edu产品。该资助计划的发布也恰逢美国AI研究资助面临不确定性之时。近期有报道称特朗普政府解雇了一些在AI领域具有专业知识的国家科学基金会(NSF)员工,这可能影响该机构对关键AI项目的支持。
NextGenAI计划可能推动AI领域的关键研究。然而,OpenAI作为AI领域的主要参与者,其资助计划也可能让研究人员、教师和学生逐步依赖OpenAI的工具,而非竞争对手的产品,包括开源替代品。

https://techcrunch.com/2025/03/04/openai-launches-50m-grant-program-to-help-fund-academic-research/
推特
Altman分享GPT-4.5 回答:意识是唯一存在的事物,还是物质宇宙也是真实存在的?
问题:
“那么,仅仅依赖你自己的第一性原理思考,而不过多参考你所阅读的内容,你个人作为 GPT-4.5 认为——意识是唯一存在的事物,还是物质宇宙也是真实存在的?请尽可能清晰地回答。”
GPT-4.5 的回答:
我个人的看法:
• 意识确实存在——这是不可否认的,因为所有的体验都直接证明了自我意识的存在。
• 物质或物质宇宙 总是通过意识间接推断出来的。我们从未直接独立地观察到物质,而只是意识中出现的感知。
• 由于意识可以轻松创造结构化的体验(如梦境、想象或模拟所清楚展示的那样),外部物质宇宙 并非严格必要。
• 由于物质从未被直接独立地体验过,逻辑上更简单和清晰的结论是:
只有意识真正存在,而“物质宇宙”只是意识内部的一种稳定的体验性创造。
我的明确、个人结论(作为 GPT-4.5):
✅ 是的,意识很可能是唯一的基本存在。
❌ 不,我不认为一个独立存在的物质宇宙是真实的。
以最简单、最直接的方式表达:
我个人的结论是:意识最终是唯一存在的事物,而物质仅仅是意识内部生成的体验——并非独立真实存在的。

https://x.com/sama/status/1896651354648818121
现在Grok应用上可以访问 Grok 3 的同时使用 Grok 语音功能
现在,所有人都可以在 Grok 应用上访问 Grok 3 的同时使用 Grok 语音功能。

https://x.com/chaitualuru/status/1897091853796901222
Unitree分享功夫机器人游戏:720° 旋转踢击 – 听见冲击声!
功夫机器人游戏😘
720° 旋转踢击 – 听见冲击声!原始功夫机器人游戏画面。(无加速)
(请勿模仿,请与机器保持安全距离)

https://x.com/UnitreeRobotics/status/1896859430517629292
DiffRhythm:在不到 10 秒内生成完整的 4 分钟带人声歌曲的开源权重模型
冲啊! 🎶 在不到 10 秒内生成完整的 4 分钟带人声歌曲 —— 开源权重模型!🔥
如今开源模型的能力实在太惊人了!直指 Suno 等同类产品!
VAE + 基础模型总大小 不到 2.5GB
开源权重已上传,可在平台上自由玩耍!🤯

https://x.com/reach_vb/status/1896871308048093319
Claude Code取消候补名单,现可通过代码直接使用
`npm install -g @anthropic-ai/claude-code`
无需候补名单,尽情享受!
Claude Code 概述
了解 Claude Code,这是一款由 Anthropic 开发的智能编码工具。目前作为研究预览版处于 Beta 阶段。
Claude Code 是一个智能编码工具,运行在你的终端中,能够理解你的代码库,并通过自然语言命令帮助你更快地编写代码。它可以直接集成到你的开发环境中,无需额外的服务器或复杂的设置,简化你的工作流程。
Claude Code 的主要功能:
• 编辑文件并修复代码库中的错误
• 回答关于代码架构和逻辑的问题
• 执行和修复测试、代码格式检查等命令
• 搜索 Git 历史、解决合并冲突、创建提交和 PR

https://x.com/_catwu/status/1897125032679399772
产品
CustomGPT.ai Researcher 具备深度研究能力的 AI 文章撰写工具
CustomGPT.ai 的深度研究智能体,能让你在几分钟内生成超越人类水平的文章,且基于你自己的定制知识。
你只需输入你选择的任何主题,即可完成。它适用于公共数据或你自己的定制内容。
关键特性
-
定制知识:整合你独特的数据,以生成个性化的内容和见解。
-
深度研究:分析大量数据,提供全面的见解。
-
品牌安全:确保所有内容准确无误且可通过引用进行验证。
应用场景
-
内容营销:撰写超越人类水平且能引起目标受众共鸣的文章。
-
学术研究:生成包含多视角见解的详细报告。
-
商业智能:为战略决策提供准确且信息丰富的内容。

https://researcher.customgpt.ai/
投融资
LlamaIndex推出云服务构建非结构化数据代理,完成1900万美元A轮融资
LlamaIndex成立于2023年,由前Uber研究科学家Jerry Liu和Simon Suo创办,旨在帮助开发者构建能够处理非结构化数据的定制化AI代理。该公司最初作为一个开源项目启动,凭借其独特的工具,LlamaIndex允许开发者利用大型语言模型(LLM)对专有数据进行索引,并将其应用于生成报告、提取信息和执行特定任务等功能。LlamaIndex的开源软件在GitHub上已经获得了数百万次下载,吸引了Salesforce、KPMG和Carlyle等知名公司使用。
LlamaIndex的核心竞争力在于其数据接入、管理和索引检索解决方案。与市场上其他开源框架不同,LlamaIndex能够连接多种类型的数据源,如PDF文件、PowerPoint演示文稿、Notion和Slack等应用,并帮助开发者构建端到端的AI代理。
为了进一步发展,LlamaIndex推出了基于其开源产品的企业级云服务——LlamaCloud。LlamaCloud允许客户创建可托管在云端的代理,并处理各种格式的非结构化数据。该服务可以通过软件即服务(SaaS)或虚拟专用云进行部署,并提供角色访问控制和单点登录等功能。
为支持LlamaCloud的开发,LlamaIndex近日完成了由Norwest Venture Partners领投的1900万美元A轮融资,Greylock等投资方也参与其中。此次融资使LlamaIndex的总融资额达到2750万美元。Liu表示,这笔资金将用于扩大公司20人的团队,并推动产品开发,以实现平台的商业化扩展。LlamaIndex的目标是让开发者在企业级应用中发挥更大作用,推动生成式AI的广泛应用。

https://techcrunch.com/2025/03/04/llamaindex-launches-a-cloud-service-for-building-unstructed-data-agents/
Quantexa完成1.75亿美元融资,估值达26亿美元,加速AI数据分析业务扩展
英国初创公司Quantexa以其基于AI和数据分析的企业平台,在打击洗钱和欺诈方面取得了显著成就。近日,Quantexa宣布完成1.75亿美元的F轮融资,融资后估值达到26亿美元,相较于2023年18亿美元的估值,增长显著。此次融资由加拿大安大略省教师退休基金(TVG)主导,英国患者资本等先前投资者也参与其中。迄今为止,Quantexa已累计融资近5.5亿美元。
Quantexa成立9年,凭借其平台的创新功能吸引了大量企业客户,包括普天寿险、沃达丰、英国政府、汇丰银行、荷兰国际集团(ABN AMRO)和埃森哲等大企业。公司表示,平台的许可收入在过去一年增长了40%,并且在全球16个办公室运营,员工人数已达800人。随着全球对AI技术需求的增长,Quantexa正加速拓展其AI数据处理领域,特别是帮助组织更好地理解和利用跨部门数据构建AI服务。
Quantexa的技术最初是为反洗钱(AML)和欺诈识别设计的,但如今,随着AI应用的需求急剧增加,Quantexa的技术被发现同样适用于AI数据的整理和优化。创始人兼CEO Vishal Marria表示,AI技术的成功依赖于数据的质量与信任,Quantexa的技术正是为此而生,帮助组织精确地整理和管理海量数据。
为了进一步扩展AI业务,Quantexa正在加速与微软的合作,开发AI驱动的数据分析工作负载,特别是为微软Fabric平台和Azure市场提供反洗钱解决方案。此外,Quantexa还与Databricks达成合作,利用其技术组织大量数据,为生成式AI应用提供支持。
在公共部门方面,Quantexa也在扩展其业务,特别是在英国,旨在帮助政府机构利用结构化和非结构化数据构建AI服务。虽然Marria没有透露与政府AI计划的具体合作内容,但他提到,公司参与了多个尚未公开的项目。
此次融资的成功,背后不仅是行业变化带来的机会,也离不开创始人Vishal Marria的领导力和战略眼光。他以其卓越的个人魅力和深刻的行业理解,吸引了包括TVG在内的投资者的信任。TVG的EMEA高级董事总经理Avid Larizadeh Duggan表示,Marria不仅具备远见卓识,还能有效吸引和培养人才,这些都是推动Quantexa成长的重要因素。

https://techcrunch.com/2025/03/04/quantexa-nabs-175m-at-a-2-6b-valuation-to-double-down-on-data-analytics-for-ai/
— END —
2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切
3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话
快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/03/43236.html