大模型日报(2月28日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息


如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。


大模型日报(2月28日 资讯篇)


潜空间第季活动开始报名!!
【第 1 期嘉宾介绍】张月光——沐言智语创始人、产品经理,目前聚焦在 AI ToC 产品的创新探索。5 年阿里工作经验,从 0 到 1 创办妙鸭相机,还曾经从 0 到 1 打造二次元换装语音社交产品“元音”。本次张月光将带来《 AI 应用探索的一些实践》的分享。
大模型日报(2月28日 资讯篇)

资讯

01


GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情


2025年2月28日,OpenAI发布了其最新研究预览版本——GPT-4.5,这是OpenAI迄今为止最大、最强大的聊天模型。GPT-4.5在扩展预训练和后训练方面取得了显著进展,通过扩大无监督学习规模,模型在识别模式、建立联系和产生创造性见解方面的能力得到了提升,且无需依赖推理。早期测试表明,GPT-4.5的交互更加自然,知识库更广泛,能够更好地遵循用户意图,情商更高,尤其在写作、编程和解决实际问题等任务中表现出色,同时幻觉现象也有所减少。

GPT-4.5的发布引起了广泛关注,Cognition联合创始人兼CEO Scott Wu分享了使用体验,认为该模型在智能体编码基准测试中表现优异,相较于o1和4o实现了大幅改进。尽管GPT-4.5和Claude 3.7 Sonnet在整体基准测试中得分相似,但在具体任务上各有优势:GPT-4.5在涉及架构和跨系统交互的任务上表现更强,而Claude 3.7 Sonnet在原始编码和代码编辑上更胜一筹。

目前,GPT-4.5仅支持搜索、上传文件和图片以及画布功能,暂不支持语音模式、视频和屏幕共享等多模态功能。从2月28日起,ChatGPT Pro用户可以在网页版、手机版和桌面版中使用GPT-4.5,随后将逐步向Plus、Team、企业和Edu用户开放。

在基准测试中,GPT-4.5在SimpleQA数据集上的准确率最高,幻觉率最低,展现了其强大的世界知识和可靠性。此外,OpenAI开发了新的可扩展技术,利用较小模型的数据来训练更大、更强的模型,提升了GPT-4.5的可操纵性、对细微差别的理解和自然对话水平。测试人员更倾向于选择GPT-4.5的查询结果,其在理解人类意图和情感方面表现出色,能够以更细致入微的方式解读微妙的暗示或隐含的期望。

然而,GPT-4.5并非推理模型,其优势在于无监督学习,通过扩大计算和数据规模以及架构和优化创新,提升了模型对世界的深刻理解和直觉能力。尽管在写作、设计等需要高情商和创造力的领域表现出色,但在数学和真实编程能力上仍逊色于o3-mini。

GPT-4.5的API现已向所有付费用户开放,支持聊天补全API、助手API和批处理API等功能,并支持图像输入。不过,由于其庞大的体量和对计算资源的高需求,API价格大幅上涨,每1M token收费75美元,比GPT-4o的2.5美元高出30倍。OpenAI也在评估是否长期在API中提供GPT-4.5,以平衡现有功能支持和未来模型开发的需求。

尽管GPT-4.5的发布引发了对其高昂价格的讨论,但其在无监督学习方面的进步仍然值得关注。OpenAI通过扩大预训练计算规模,进一步验证了Scaling Law的有效性。GPT-4.5的发布不仅是技术上的进步,也为未来模型的发展提供了新的方向。

大模型日报(2月28日 资讯篇)

https://mp.weixin.qq.com/s/GtLcOA1aF_7bm8J69dqqog



02

DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」


2025年2月28日,DeepSeek开源周迎来收官之作,开源了名为3FS(Fire-Flyer File System)的并行文件系统。3FS专为AI训练和推理工作负载设计,利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的全部带宽,显著提升数据访问速度。在性能方面,3FS在180节点集群中实现6.6 TiB/s的聚合读取吞吐量;在25节点集群的GraySort基准测试中达到3.66 TiB/min的吞吐量;每个客户端节点在KVCache查找时可达到40+ GiB/s的峰值吞吐量。其采用分离式架构,具备强一致性语义。

3FS支持多种应用场景,包括训练数据预处理、数据集加载、检查点保存与重新加载、用于推理的嵌入向量搜索和KVCache查找。DeepSeek的V3、R1模型均采用了该系统。开源链接为https://github.com/deepseek-ai/3FS,同时开源的还有Smallpool(3FS上的数据处理框架),链接为https://github.com/deepseek-ai/smallpond。

3FS的主要特点和优势包括:性能和可用性方面,分离式架构结合了数千个SSD的吞吐量和数百个存储节点的网络带宽,应用程序可不受位置限制地访问存储资源;通过实现带有分配查询的链式复制(CRAQ)保证强一致性,使应用程序代码简单易懂;开发了由事务性键值存储支持的无状态元数据服务,文件接口广为人知且无需学习新的存储API。在多样化工作负载方面,3FS可高效管理数据准备阶段的大量中间输出,支持跨计算节点对训练样本的随机访问,无需预取或打乱数据集;支持大规模训练的高吞吐量并行检查点保存;为基于DRAM的缓存提供成本效益高的替代方案,具有高吞吐量和显著更大的容量。

在性能测试中,3FS在大型集群上展现出卓越的读取吞吐量。集群由180个存储节点组成,每个节点配备2×200Gbps InfiniBand网卡和16个14TiB NVMe SSD,约500+个客户端节点用于读取压力测试,最终聚合读取吞吐量达到约6.6 TiB/s。在GraySort基准测试中,测试集群由25个存储节点和50个计算节点组成,对110.5 TiB数据进行排序耗时30分14秒,平均吞吐量为3.66 TiB/分钟。KVCache测试中,峰值吞吐量高达40 GiB/s。

DeepSeek通过此次开源周收获了大量开发者关注,3FS和Smallpond被认为在AI数据处理方面树立了新标杆。

大模型日报(2月28日 资讯篇)

https://mp.weixin.qq.com/s/p8KGnYIqmCkXPF4jjRiKjQ



03
元资助

模型+工程创新持续唤醒算力,DeepSeek撬动推理需求蓝海


中金公司发布报告《AI进化论(2):模型+工程创新持续唤醒算力,DeepSeek撬动推理需求蓝海》,深入分析了DeepSeek(DS)在模型推理方面的创新及其对硬件需求的影响。报告指出,DS团队在模型优化和硬件工程化优化方面取得了双重创新。模型创新方面,DS引入多头潜在注意力机制(MLA)和原生稀疏注意力机制(NSA),前者通过压缩KV存储降低内存需求,后者通过压缩序列长度优化长文本建模,均显著提升推理效率。硬件工程化创新方面,DS采用Prefill/Decode分离策略,针对不同阶段的计算特性优化硬件配置,并在Decode阶段采用高专家并行度(EP320),提升计算单元利用效率,开源MLA内核为其他硬件适配提供思路。

报告认为,集群推理将成为主流,利好以太网通信设备需求。DeepSeek的开源成果推动云端和私域部署需求增长,如微信接入DS模型可能带来数十万主流推理卡的采购需求。国产算力产业链已全面适配DeepSeek,从芯片到整机加速升级,有望驱动AI应用落地。但报告也提示风险,包括生成式AI模型创新、AI算力硬件技术迭代及AI应用落地进展不及预期等。

大模型日报(2月28日 资讯篇)

https://mp.weixin.qq.com/s/imUhPZK7dPLgC4s1sFeUUg



04

RISC-V与AI今日全面「会师」


2025年2月28日,机器之心报道了RISC-V与AI的深度融合,标志着开源指令集架构RISC-V在AI领域的重大突破。文章指出,DeepSeek的出现不仅改变了AI行业,也对芯片行业产生了深远影响。它通过深度优化大幅降低了大模型的训练和推理成本,打破了传统AI大模型对高算力的依赖,推动AI从云端走向端侧设备。这种转变促使AI芯片形态重构,从依赖云计算的大规模并行计算走向低功耗、多样化的边缘设备芯片。

RISC-V因其开源、开放、灵活和可扩展性受到关注。与x86和ARM不同,RISC-V允许开发者定制指令集,其向量扩展(V-extension)能有效处理大规模并行运算,满足AI计算需求。达摩院玄铁在春节期间成功适配DeepSeek-R1系列模型至RISC-V处理器玄铁C920,仅耗时1小时,展现了RISC-V在AI部署上的高效性。

在第三届玄铁RISC-V生态大会上,达摩院推出了首款服务器级CPU C930,其通用性能算力达到SPECint2006基准测试15/GHz,搭载512 bits RVV1.0和8 TOPS Matrix双引擎,将通用高性能算力与AI算力原生结合。此外,达摩院还披露了C908X、R908A、XL200等新处理器的研发计划,分别面向AI加速、车规级芯片和高速互联等方向。同时,玄铁基于Linux、Android、RTOS推出三套SDK,整合软件能力,助力RISC-V在高性能和AI场景的开发。

自2018年成立以来,玄铁一直是RISC-V生态的引领者,推出了13款处理器,覆盖多种场景,出货量超40亿颗。其在指令集架构技术层面定制了面向AI应用的指令集扩展,如矩阵运算扩展,显著提升了AI推理和训练效率。在处理器上,C907首次实现Matrix扩展,C920支持Vector 1.0和Vector Crypto技术,性能大幅提升。最新旗舰处理器C930兼具vector和matrix双引擎,有望成为端侧AI大模型的理想搭档。

玄铁还打造了端到端的RISC-V AI全栈软硬件平台,应用于多种终端产品,并联合合作伙伴构建了视频编解码方案、云桌面解决方案等。中科院软件所介绍了基于C920的AI PC原型机,跑通了Llama、Qwen、DeepSeek等开源模型,打通了从开源硬件架构到开源操作系统、再到开源AI模型的全链路,单位计算能耗降低了30%。

文章最后指出,RISC-V作为开源指令集架构,与封闭的x86和授权模式的ARM不同,其开源、开放、灵活的特性使其成为AI时代原生架构的最佳候选。它能够跟上AI快速变化的步伐,通过移植适配与原有架构生态兼容,也能作为原生架构支撑新场景。

大模型日报(2月28日 资讯篇)

https://mp.weixin.qq.com/s/uP7AAo–814AyboSGEc8Nw




推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

智能代理文档提取:更准确的提取PDF核心含义


📢 重磅发布:智能代理文档提取!

PDF 文件不仅仅是文本,它们通过布局、图表、图形等方式以视觉形式呈现信息。与传统的 OCR 和大多数 PDF 转文本方法不同,这种智能代理方法能够将文档拆解为不同的组件并进行推理,从而更准确地提取其核心含义,以用于 RAG(检索增强生成) 及其他应用。

📺 观看视频了解详情!

大模型日报(2月28日 资讯篇)

https://x.com/AndrewYNg/status/1895183929977843970




02 

Pika2.2上线:10秒级生成,1080p高清分辨率, Pikaframes – 关键帧过渡可设置 1-10 秒


🔥 Pika 2.2 来了!

⚡ 10秒级生成

📺 1080p高清分辨率

🎞 Pikaframes – 关键帧过渡可设置 1-10 秒

更多变换,更多创意!立即体验 👉 Pika dot art

大模型日报(2月28日 资讯篇)

https://x.com/pika_labs/status/1895156950431867318



03


Mercury推出:首个商用级扩散大型语言模型,Karpathy评价这是一个有趣的突破


🚀 隆重推出 Mercury —— 首个商用级扩散大型语言模型(dLLM)!

dLLM 通过并行、粗到细的文本生成,在智能与速度上突破极限,推动 AI 发展前沿。


Andrej Karpathy:这是一个有趣的突破,作为首个基于扩散的 LLM(大型语言模型)。

目前你所见的大多数 LLM 在核心建模方法上几乎都是“克隆版”——它们都是自回归(autoregressive)训练的,也就是从左到右依次预测下一个 token。而扩散模型(Diffusion)则完全不同,它不是从左到右生成,而是一次性地处理。它从纯噪声开始,并逐步去噪,最终形成 token 流。

事实上,大多数图像和视频生成 AI 都是采用扩散模型,而非自回归。只有文本(以及某些音频)仍然坚持自回归方法。这一直是个未解之谜:为什么文本更倾向于自回归,而图像/视频更适合扩散?这个问题涉及信息分布、噪声特性以及我们人类的感知方式,是一个相当深奥的议题。但如果深入研究,就会发现这两种方法之间其实存在许多有趣的联系。

总的来说,这款新模型可能会带来不一样的体验,甚至展现出全新的心理学特征,或是在特定任务上展现独特的优势和劣势。我鼓励大家去试试看!

大模型日报(2月28日 资讯篇)

https://x.com/InceptionAILabs/status/1894847919624462794

https://x.com/karpathy/status/1894923254864978091



04


Ideogram 2a:Ideogram目前最快、最经济实惠的文本生成图像模型,专为平面设计和摄影优化


欢迎体验 Ideogram 2a!

我们迄今为止最快、最经济实惠的文本生成图像(text-to-image)模型,专为平面设计和摄影优化。

现已在 Ideogram 官网、API 及合作平台 全面上线,所有用户均可使用!

大模型日报(2月28日 资讯篇)

https://x.com/ideogram_ai/status/1895157668102222075



05


Meta推出 Aria Gen 2:解锁机器感知、上下文 AI、机器人技术等领域的全新研究


推出 Aria Gen 2——新一代眼镜,我们希望它能帮助业界和学术界的研究人员在机器感知、上下文 AI、机器人技术等领域解锁新的研究。

Aria Gen 2 详情及可用性更新注册 ➡️ https://go.fb.me/8rku3b

大模型日报(2月28日 资讯篇)

https://x.com/AIatMeta/status/1895187608969584660



06



Perplexity 全新语音模式:随时提问,实时获取答案


推出 Perplexity 全新语音模式。

随时提问,实时获取答案。

更新你的 iOS 应用即可使用,Android 和 Mac 版本即将上线。

大模型日报(2月28日 资讯篇)

https://x.com/perplexity_ai/status/1894788583770509505




产品

01


Rapport AI-Driven Avatars:AI创建属于你自己的实时数字角色


为 ChatGPT 和其他人工智能赋予动画效果,以便与数字角色进行实时对话。

创建语音驱动的虚拟形象,并在可扩展的云平台上 快速发布。

✅人工智能应该让人感觉像人类,而不仅仅是智能

✅实时反应让虚拟形象更具吸引力,也更能引起共鸣

✅与虚幻引擎无缝集成,带来新一代的体验

大模型日报(2月28日 资讯篇)

https://www.rapport.cloud/





投融资

01

瑞士AI金融平台Unique完成3000万美元A轮融资,加速国际扩张


瑞士金融科技初创公司Unique于2025年2月27日宣布完成3000万美元A轮融资。本轮融资由伦敦风险投资公司DN Capital和德国商业银行旗下的CommerzVentures联合领投。Unique成立于2021年,专注于为金融服务行业提供“代理型AI”解决方案,旨在通过自动化工作流程提升银行、保险和私募股权领域的效率。

Unique的AI产品包括投资研究代理和尽职调查代理等,能够通过自然语言处理和数据分析提供智能化解决方案。公司最初专注于AI驱动的销售视频领域,后逐步转型为金融团队的“副驾驶”系统,并于2023年与瑞士私人银行Pictet达成合作。目前,Unique已与多家知名瑞士金融机构建立合作关系,包括UBP和Graubündner Kantonalbank。

此次融资将助力Unique加速国际扩张,尤其是美国市场的布局。截至目前,Unique已累计融资5300万美元

大模型日报(2月28日 资讯篇)

https://techcrunch.com/2025/02/27/unique-a-swiss-ai-platform-for-finance-raises-30m/



02

雪花公司为初创加速器注入2亿美元新资本,加速AI领域布局


2025年2月27日,专注于云数据存储的科技巨头Snowflake宣布将为其初创加速器注入2亿美元新资本,进一步拓展其在AI领域的影响力。此次资金注入是Snowflake一系列增长举措的一部分,旨在通过加速器计划支持早期初创公司,尤其是那些基于Snowflake构建行业特定AI产品的公司。

Snowflake初创加速器(前身为“Snowflake助力计划”)为入选企业提供技术支持、联合营销机会以及亚马逊云服务(AWS)的使用额度。此前的加速器毕业生包括Coalesce、Andrew Ng的LandingAI和TwelveLabs等知名初创公司。

此次2亿美元的资金部分来自Snowflake的新老风险投资合作伙伴,包括Bain Capital Ventures、Blackstone Innovations Investments、Bessemer Venture Partners、Capital One Ventures、General Catalyst、Greylock Partners等。然而,Snowflake也指出,尽管参与的风投公司可能会对加速器内的企业进行投资,但并不能保证每家公司都能获得资金,且最终投资金额也存在不确定性。

除了加速器计划,Snowflake还宣布了一系列其他举措,包括在其门洛帕克园区新建一个3万平方英尺的“AI中心”,以及启动一个2000万美元的AI技能培训项目。此外,Snowflake本周还宣布扩大与微软的合作,提供OpenAI模型的访问权限,并于去年与Anthropic达成多年合作,收购了AI数据管道公司Datavolo。

Snowflake的积极投资策略似乎取得了成效。在最近一个财季(2024年第四季度),公司收入达到9.87亿美元,超出华尔街分析师的预期

大模型日报(2月28日 资讯篇)
https://techcrunch.com/2025/02/27/snowflake-grows-startup-accelerator-with-200m-in-new-capital/


推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话


快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/43173.html

Like (0)
Previous 2025-02-27 21:32
Next 2025-03-01 09:32

相关推荐