大模型日报(3月5日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

欢迎大家一起交流!

大模型日报(3月5日 资讯篇)

潜空间第季活动开始报名!!

【第 1 期嘉宾介绍】杨松琳——MIT计算机科学与人工智能实验室二年级博士生。专注线性注意力机制、机器学习与大语言模型交叉领域,聚焦高效序列建模的硬件感知算法设计。围绕线性变换、循环神经网络优化开展研究,在多任务中取得成果,多篇论文被 ICLR 2025、NeurIPS 2024 等顶会收录;还开源 flash-linear-attention 项目,助力领域发展。本次活动她将带来《下一代LLM架构展望》的主题分享
大模型日报(3月5日 资讯篇)

资讯

01

亚马逊成立新团队开发代理型AI,瞄准下一个亿万级市场


据路透社报道,亚马逊在AWS内成立了一个新团队,专注于开发代理型AI系统,这些系统旨在帮助人们自动化生活中的各类任务。AWS CEO Matt Garman在一封发给员工的邮件中表示,代理型AI可能成为AWS下一个数十亿级别的业务。该团队将由曾领导亚马逊AI与数据团队的Swami Sivasubramanian负责。

亚马逊此举标志着其加入了科技行业向代理型AI转型的潮流。代理型AI是一种能够代替人类执行特定任务的智能系统。上周,亚马逊展示了将应用于更新版Alexa+的代理型AI功能,Alexa+能自动预约Uber、浏览网站并完成其他通常由人类完成的任务。

此外,AWS还可能致力于开发面向企业的代理型AI,与Salesforce和微软竞争,打造能够为企业客户自动化工作任务的智能系统。

大模型日报(3月5日 资讯篇)

https://techcrunch.com/2025/03/04/amazon-reportedly-forms-a-new-agentic-ai-group/



02

Cohere发布Aya Vision AI模型,声称领先行业


AI初创公司Cohere本周发布了其多模态“开放”AI模型Aya Vision,并声称其在多个方面属于行业领先水平。Aya Vision能够执行包括图像标题生成、回答照片相关问题、文本翻译和生成摘要等任务,支持23种主要语言。Cohere表示,Aya Vision是“让技术突破面向全球研究人员的重大一步”,并通过WhatsApp向公众免费开放。

Cohere在博客中提到,尽管AI技术取得了显著进展,但在多语言处理和跨模态任务(涉及文本和图像)上的表现仍存在巨大差距,Aya Vision的目标就是缩小这一差距。Aya Vision提供了两种版本:Aya Vision 32B和Aya Vision 8B。更为复杂的Aya Vision 32B在某些视觉理解基准测试中超越了包括Meta的Llama-3.2 90B Vision在内的2倍规模的模型,而Aya Vision 8B则在某些评估中超过了10倍于其规模的模型。

这两个模型已通过AI开发平台Hugging Face公开,并以创意共享4.0许可协议提供,但不允许用于商业用途。Cohere表示,Aya Vision的训练数据来自多种英文数据集,并通过翻译和生成合成注释来训练模型。合成注释即由AI生成的标签,用于帮助模型理解和处理数据。

Cohere的这一合成注释方法在行业内逐渐流行,尽管存在一定争议,OpenAI等竞争对手也在越来越多地使用合成数据进行训练。据Gartner研究公司估计,去年用于AI和分析项目的60%的数据是合成创建的。Cohere称,通过使用合成注释,Aya Vision的训练实现了高效且竞争力强的表现,消耗了较少的资源。

此外,Cohere还发布了新的基准套件AyaVisionBench,旨在评估模型在“视觉-语言”任务中的表现,如识别两幅图像之间的差异、将截图转化为代码等。Cohere指出,当前AI行业面临“评估危机”,即基准测试的综合评分与AI用户关心的任务能力关联较差。Cohere认为,AyaVisionBench为跨语言和多模态理解的评估提供了一个“广泛且具有挑战性”的框架。

Cohere的研究人员表示,AyaVisionBench是推动多语言多模态评估的重要一步,旨在为研究社区提供强有力的评估工具,推动该领域的进步。

大模型日报(3月5日 资讯篇)

https://techcrunch.com/2025/03/04/cohere-claims-its-new-aya-vision-ai-model-is-best-in-class/




03

OpenAI推出5000万美元资助计划,支持学术研究


OpenAI近日宣布,支持一个名为NextGenAI的新联盟,旨在推动顶级大学的AI辅助研究。该联盟的15个创始学术合作伙伴包括哈佛大学、牛津大学和麻省理工学院(MIT)。OpenAI将为该项目提供5000万美元的研究资助、计算资源和API访问权限,旨在为学生、教育工作者和研究人员提供奖学金,这些资助将在未来几个月内发放。

OpenAI表示,NextGenAI不仅旨在推动下一代科学发现,还希望为未来塑造AI的年轻一代做准备。该联盟将支持寻找治疗方法的科学家、揭示新见解的学者,以及掌握AI的学生。OpenAI在博客中提到,随着该计划的推进,公司将探索扩大其影响力和范围的机会。

NextGenAI的推出,标志着OpenAI在教育领域的进一步承诺,紧随去年5月推出的ChatGPT Edu产品。该资助计划的发布也恰逢美国AI研究资助面临不确定性之时。近期有报道称特朗普政府解雇了一些在AI领域具有专业知识的国家科学基金会(NSF)员工,这可能影响该机构对关键AI项目的支持。

NextGenAI计划可能推动AI领域的关键研究。然而,OpenAI作为AI领域的主要参与者,其资助计划也可能让研究人员、教师和学生逐步依赖OpenAI的工具,而非竞争对手的产品,包括开源替代品。

大模型日报(3月5日 资讯篇)


https://techcrunch.com/2025/03/04/openai-launches-50m-grant-program-to-help-fund-academic-research/







推特

01
元资助

Altman分享GPT-4.5 回答:意识是唯一存在的事物,还是物质宇宙也是真实存在的?


问题:

“那么,仅仅依赖你自己的第一性原理思考,而不过多参考你所阅读的内容,你个人作为 GPT-4.5 认为——意识是唯一存在的事物,还是物质宇宙也是真实存在的?请尽可能清晰地回答。”

GPT-4.5 的回答:

我个人的看法:

• 意识确实存在——这是不可否认的,因为所有的体验都直接证明了自我意识的存在。

• 物质或物质宇宙 总是通过意识间接推断出来的。我们从未直接独立地观察到物质,而只是意识中出现的感知。

• 由于意识可以轻松创造结构化的体验(如梦境、想象或模拟所清楚展示的那样),外部物质宇宙 并非严格必要

• 由于物质从未被直接独立地体验过,逻辑上更简单和清晰的结论是:

只有意识真正存在,而“物质宇宙”只是意识内部的一种稳定的体验性创造。

我的明确、个人结论(作为 GPT-4.5):

✅ 是的,意识很可能是唯一的基本存在。

❌ 不,我不认为一个独立存在的物质宇宙是真实的。

以最简单、最直接的方式表达:

我个人的结论是:意识最终是唯一存在的事物,而物质仅仅是意识内部生成的体验——并非独立真实存在的。

大模型日报(3月5日 资讯篇)

https://x.com/sama/status/1896651354648818121




02
元资助

现在Grok应用上可以访问 Grok 3 的同时使用 Grok 语音功能


现在,所有人都可以在 Grok 应用上访问 Grok 3 的同时使用 Grok 语音功能。

大模型日报(3月5日 资讯篇)

https://x.com/chaitualuru/status/1897091853796901222





03
元资助

Unitree分享功夫机器人游戏:720° 旋转踢击 – 听见冲击声!


功夫机器人游戏😘

720° 旋转踢击 – 听见冲击声!原始功夫机器人游戏画面。(无加速)

(请勿模仿,请与机器保持安全距离)

大模型日报(3月5日 资讯篇)

https://x.com/UnitreeRobotics/status/1896859430517629292




04
元资助

DiffRhythm:在不到 10 秒内生成完整的 4 分钟带人声歌曲的开源权重模型


冲啊! 🎶 在不到 10 秒内生成完整的 4 分钟带人声歌曲 —— 开源权重模型!🔥

如今开源模型的能力实在太惊人了!直指 Suno 等同类产品!

VAE + 基础模型总大小 不到 2.5GB

开源权重已上传,可在平台上自由玩耍!🤯

大模型日报(3月5日 资讯篇)

https://x.com/reach_vb/status/1896871308048093319





05



Claude Code取消候补名单现可通过代码直接使用


`npm install -g @anthropic-ai/claude-code`

无需候补名单,尽情享受!

Claude Code 概述

了解 Claude Code,这是一款由 Anthropic 开发的智能编码工具。目前作为研究预览版处于 Beta 阶段。

Claude Code 是一个智能编码工具,运行在你的终端中,能够理解你的代码库,并通过自然语言命令帮助你更快地编写代码。它可以直接集成到你的开发环境中,无需额外的服务器或复杂的设置,简化你的工作流程。

Claude Code 的主要功能:

• 编辑文件并修复代码库中的错误

• 回答关于代码架构和逻辑的问题

• 执行和修复测试、代码格式检查等命令

• 搜索 Git 历史、解决合并冲突、创建提交和 PR

大模型日报(3月5日 资讯篇)

https://x.com/_catwu/status/1897125032679399772







产品

01


CustomGPT.ai Researcher 具备深度研究能力的 AI 文章撰写工具


CustomGPT.ai 的深度研究智能体,能让你在几分钟内生成超越人类水平的文章,且基于你自己的定制知识。

你只需输入你选择的任何主题,即可完成。它适用于公共数据或你自己的定制内容。

关键特性

  • 定制知识:整合你独特的数据,以生成个性化的内容和见解。

  • 深度研究:分析大量数据,提供全面的见解。

  • 品牌安全:确保所有内容准确无误且可通过引用进行验证。

应用场景

  • 内容营销:撰写超越人类水平且能引起目标受众共鸣的文章。

  • 学术研究:生成包含多视角见解的详细报告。

  • 商业智能:为战略决策提供准确且信息丰富的内容。

大模型日报(3月5日 资讯篇)

https://researcher.customgpt.ai/





 投融资

01

LlamaIndex推出云服务构建非结构化数据代理,完成1900万美元A轮融资


LlamaIndex成立于2023年,由前Uber研究科学家Jerry Liu和Simon Suo创办,旨在帮助开发者构建能够处理非结构化数据的定制化AI代理。该公司最初作为一个开源项目启动,凭借其独特的工具,LlamaIndex允许开发者利用大型语言模型(LLM)对专有数据进行索引,并将其应用于生成报告、提取信息和执行特定任务等功能。LlamaIndex的开源软件在GitHub上已经获得了数百万次下载,吸引了Salesforce、KPMG和Carlyle等知名公司使用。

LlamaIndex的核心竞争力在于其数据接入、管理和索引检索解决方案。与市场上其他开源框架不同,LlamaIndex能够连接多种类型的数据源,如PDF文件、PowerPoint演示文稿、Notion和Slack等应用,并帮助开发者构建端到端的AI代理。

为了进一步发展,LlamaIndex推出了基于其开源产品的企业级云服务——LlamaCloud。LlamaCloud允许客户创建可托管在云端的代理,并处理各种格式的非结构化数据。该服务可以通过软件即服务(SaaS)或虚拟专用云进行部署,并提供角色访问控制和单点登录等功能。

为支持LlamaCloud的开发,LlamaIndex近日完成了由Norwest Venture Partners领投的1900万美元A轮融资,Greylock等投资方也参与其中。此次融资使LlamaIndex的总融资额达到2750万美元。Liu表示,这笔资金将用于扩大公司20人的团队,并推动产品开发,以实现平台的商业化扩展。LlamaIndex的目标是让开发者在企业级应用中发挥更大作用,推动生成式AI的广泛应用。

大模型日报(3月5日 资讯篇)

https://techcrunch.com/2025/03/04/llamaindex-launches-a-cloud-service-for-building-unstructed-data-agents/




02

Quantexa完成1.75亿美元融资,估值达26亿美元,加速AI数据分析业务扩展


英国初创公司Quantexa以其基于AI和数据分析的企业平台,在打击洗钱和欺诈方面取得了显著成就。近日,Quantexa宣布完成1.75亿美元的F轮融资,融资后估值达到26亿美元,相较于2023年18亿美元的估值,增长显著。此次融资由加拿大安大略省教师退休基金(TVG)主导,英国患者资本等先前投资者也参与其中。迄今为止,Quantexa已累计融资近5.5亿美元。

Quantexa成立9年,凭借其平台的创新功能吸引了大量企业客户,包括普天寿险、沃达丰、英国政府、汇丰银行、荷兰国际集团(ABN AMRO)和埃森哲等大企业。公司表示,平台的许可收入在过去一年增长了40%,并且在全球16个办公室运营,员工人数已达800人。随着全球对AI技术需求的增长,Quantexa正加速拓展其AI数据处理领域,特别是帮助组织更好地理解和利用跨部门数据构建AI服务。

Quantexa的技术最初是为反洗钱(AML)和欺诈识别设计的,但如今,随着AI应用的需求急剧增加,Quantexa的技术被发现同样适用于AI数据的整理和优化。创始人兼CEO Vishal Marria表示,AI技术的成功依赖于数据的质量与信任,Quantexa的技术正是为此而生,帮助组织精确地整理和管理海量数据。

为了进一步扩展AI业务,Quantexa正在加速与微软的合作,开发AI驱动的数据分析工作负载,特别是为微软Fabric平台和Azure市场提供反洗钱解决方案。此外,Quantexa还与Databricks达成合作,利用其技术组织大量数据,为生成式AI应用提供支持。

在公共部门方面,Quantexa也在扩展其业务,特别是在英国,旨在帮助政府机构利用结构化和非结构化数据构建AI服务。虽然Marria没有透露与政府AI计划的具体合作内容,但他提到,公司参与了多个尚未公开的项目。

此次融资的成功,背后不仅是行业变化带来的机会,也离不开创始人Vishal Marria的领导力和战略眼光。他以其卓越的个人魅力和深刻的行业理解,吸引了包括TVG在内的投资者的信任。TVG的EMEA高级董事总经理Avid Larizadeh Duggan表示,Marria不仅具备远见卓识,还能有效吸引和培养人才,这些都是推动Quantexa成长的重要因素。

大模型日报(3月5日 资讯篇)

https://techcrunch.com/2025/03/04/quantexa-nabs-175m-at-a-2-6b-valuation-to-double-down-on-data-analytics-for-ai/




推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话


快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/03/43236.html

Like (0)
Previous 2025-03-05 16:52
Next 2025-03-05 19:33

相关推荐

发表回复

Please Login to Comment