我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!

资讯
马斯克Grok 3险胜DeepSeek,疯狂启动钞能力,压力给到OpenAI
2025年2月18日,马斯克的xAI团队发布了Grok-3,这是基于20万块GPU集群训练的最新AI模型。Grok-3在基准测试中击败了Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet和GPT-4o等竞争对手。此次发布的还有Grok-3 mini、推理模型Grok-3 Reasoning和Grok-3 mini Reasoning,以及首个AI智能体DeepSearch。Grok-3的训练量是Grok-2的10倍,其训练建立在xAI孟菲斯的AI超级计算机集群上,该集群第一阶段拥有10万块NVIDIA H100 GPU,第二阶段扩展到20万块仅用92天。Grok-3在数学问题样本的AIME测试和博士水平的GPQA、LCB Oct-Feb测试中表现优异,在Chatbot Arena中获得1400分,排名第一。xAI还计划几个月后开源Grok-2。Grok-3的语音交互功能通过原生语音交互模型实现,无需中间环节。马斯克透露,未来xAI将加大数据中心建设力度,下一个计算集群能耗将达到1.2GW。Grok-3的训练基于合成数据,能够通过检查数据来反映错误并达到逻辑一致性。xAI正在接洽潜在投资者,计划筹集约100亿美元资金,此轮融资可能使公司估值达到约750亿美元。

200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
复旦大学知识工场实验室肖仰华教授和梁家卿青年副研究员的科研团队成功复现了DeepSeek R1的“Aha Moment”能力,并开源了相关代码。该项目名为Simple-GRPO,基于GRPO(Group Relative Policy Optimization)强化学习算法思想,仅用200多行代码实现,依赖基础的深度学习框架如deepspeed和torch,无需复杂框架。项目通过模型解耦与分离,降低了算力需求,支持在一张A800(80G)和一张3090(24G)显卡上完成7B模型的训练,单次实验成本低至7.3元人民币。
在技术细节上,项目实现了参考模型分离,允许其在不同GPU上运行,避免显存浪费。核心损失计算基于Hugging Face的trl实现。训练过程中,使用Zero-Stage 2优化,Qwen2.5-3B和Qwen2.5-7B在训练初期均出现了“顿悟时刻”现象。实验结果显示,Qwen2.5-3B在GSM8K和Math混合数据集上训练后,准确率稳定在60%以上,最高可达70%,格式遵循能力在30步后接近100%;Qwen2.5-7B在GSM8K数据集上训练时,准确率始终保持在90%以上,格式遵循能力达到100%。
未来,该项目将优化组内答案同质性问题,通过实时监控答案分布并重新采样分组,提供有效的对比信号。同时,针对长思维链显存占用问题,计划通过拆分组别、减小批次大小或分阶段处理长序列,降低GPU内存开销,提升训练效率。

低空经济:投资中国蓝天新机遇
低空经济作为新兴产业,正成为推动经济社会发展的新动力。自2024年被写入政府工作报告以来,低空经济受到政策密集支持,中央和地方政府纷纷出台产业政策和发展规划,推动其快速发展。工信部赛迪研究院预测,中国低空经济市场规模将从2023年的5060亿元增长至2026年的万亿元。
低空经济产业链涵盖飞行器制造、低空飞行、低空保障和综合服务等环节,其中飞行器和空管系统是核心基础。飞行器包括eVTOL、无人机和直升机等,eVTOL凭借速度快、低运营成本等优势,有望在景区观光等场景率先落地,并逐步拓展至城市空中交通。无人机则在测绘、巡检、物流等领域广泛应用,其市场规模在2023年达到1174亿元,产业无人机占比不断提升。直升机凭借垂直起降和悬停能力,广泛应用于救援、消防等领域。
空管系统是低空经济发展的关键保障,其智能化、网联化成为主要发展趋势。低空智联网通过整合通信、导航、监视等技术,实现低空空域的高效管理和安全运行。5G-A和卫星通信技术为低空经济提供了强大的通信支持,北斗系统则为低空飞行器提供高精度导航服务。
低空经济应用场景丰富,涵盖测绘、巡检、消防、物流、旅游和交通等多个领域。其发展遵循“载物—载人”“旅游—交通”的顺序,eVTOL的商业化有望改善传统通航企业的财务模型,推动低空经济的可持续发展。
然而,低空经济发展仍面临风险,包括产业推进不及预期和飞行器安全事故可能对产业发展造成的影响。尽管如此,随着政策支持的加强和技术的不断进步,低空经济有望成为中国蓝天经济的新机遇。

Google Fellow吴永辉博士加盟字节跳动 负责AI基础研究探索工作
2025年2月17日,谷歌资深研究员、Google Fellow吴永辉博士确认离开谷歌,加入字节跳动,担任大模型团队Seed基础研究负责人,专注于大模型基础研究和AI for Science等长期研究工作,直接汇报给字节跳动CEO梁汝波。吴永辉博士于2008年加州大学河滨分校博士毕业后加入谷歌,最初负责搜索算法工作,后于2014年加入Google Brain转向深度学习研究,是Google神经机器翻译项目和RankBrain项目的主要贡献者之一。他的研究成果在学术界影响力显著,2020年以来论文引用量超过4万次,其中谷歌神经机器翻译系统的论文获得超过9500次引用。2023年,吴永辉因在深度学习领域的贡献被晋升为Google Fellow及谷歌DeepMind研究副总裁。
此次加盟字节跳动,吴永辉将专注于长期和基础的科研工作。字节跳动近年来不断加强AI研究团队建设,此次引入吴永辉是希望借助其在深度学习领域的深厚背景,进一步提升在AI基础研究方面的人才密度。字节跳动CEO梁汝波曾表示,2025年字节跳动大模型业务的核心目标是追求“智能”的上限,而非单纯追求产品DAU(日活跃用户数)。为此,字节跳动设立了代号为“Seed Edge”的研究项目,旨在开展比预训练和大模型迭代更具前瞻性和基础性的AGI(通用人工智能)研究。

推特
NSA:一种与硬件协同优化、可原生训练的稀疏注意力机制,专为超高速长上下文训练与推理设计
🚀 介绍 NSA:一种与硬件协同优化、可原生训练的稀疏注意力机制,专为超高速长上下文训练与推理设计!
NSA 的核心组件:
• 动态分层稀疏策略
• 粗粒度的 token 压缩
• 细粒度的 token 选择
💡 通过针对现代硬件的优化设计,NSA 在加速推理的同时降低预训练成本,而不牺牲性能。在通用基准测试、长上下文任务和基于指令的推理任务中,NSA 的表现可匹敌甚至超越全注意力模型。
📖 详情请查看我们的论文:https://arxiv.org/abs/2502.11089

https://x.com/deepseek_ai/status/1891745487071609327
figma已经过时?Schirano分享:在AI时代设计和构建应用
正如承诺的那样,这是我的快速指南,教你如何在 AI 时代设计和构建应用。

Werbel分享Cursor提示词,Riley Brown:嘎嘎好用
在 Cursor 调试遇到困难?试试这个神奇的提示词 🪄
“思考 5-7 种可能导致问题的原因,提炼出 1-2 个最可能的来源,然后添加日志来验证你的假设,再进行实际的代码修复。”
如果你还需要捕获浏览器日志,可以试试我的 MCP 工具,它能全自动完成所有这些操作!链接在简介 👆
Riley Brown:试试这个,效果非常好……

Unsloth设立挑战:拿到 47 分将提供 $50 万/年 + 期权 邀请加入Unsloth
我们设立了 5 个挑战,如果你能拿到 47 分,我们将提供 $50 万/年 + 期权 邀请你加入 🦥
@UnslothAI !
无需经验或博士学位。
💰 薪资等级:
• $$40万 – $$50万/年:创始工程师(47 分)
• $$25万 -$$30万/年:机器学习工程师(32 分)
📌 挑战任务:
1. 将 nf4 / BnB 4bit 转换为 Triton
2. 让 FSDP2 兼容 QLoRA
3. 消除 torch.compile 中的图断裂问题
4. 解决 Unsloth 现有问题!
5. 实现高效的内存反向传播
如果你对挑战有任何问题,欢迎随时咨询!我们正在寻找志同道合的伙伴,共同推动 Unsloth 发展,进一步让 AI 普及化。
📜 我们的过往成果包括:
1. 1.58bit DeepSeek R1 GGUFs: 链接
2. 在 Colab 上用 Llama 3.1 8B 运行 GRPO: 链接
3. 修复 Gemma 的 bug: 链接
4. 修复梯度累积 bug: 链接
📄 详情 & 提交指南:
Colab 指南

Stepfun ai分享Step-Audio-Chat:1320 亿参数 的端到端语音语言模型,语音输入,语音输出
聊天,这是真的吗?一个 1320 亿参数 的端到端语音语言模型???
语音输入,语音输出 🤯
Apache 2.0 许可证??
该存储库包含 Step-Audio 的多模态大语言模型(LLM)组件。它是一个 1300 亿参数 的多模态 LLM,负责理解和生成人类语音。该模型专门设计用于无缝集成 语音识别、语义理解、对话管理、语音克隆 和 语音生成 等功能。

https://x.com/reach_vb/status/1891517368603492697
产品
SEO 实现端到端的工作流程自动化
-
关键词研究:能实时连接 Ahrefs、谷歌关键词规划师等工具,自动进行关键词研究,了解搜索量、难度及相关词汇。例如,当用户提出提升特定关键词排名需求时,它能迅速获取相关数据。
-
SERP 格局研究:自动研究当前谷歌搜索结果页面格局,分析内容类型和排名因素,为制定策略提供依据。
-
网站评估:检查网站当前的域名评级和自然关键词,了解网站自身 SEO 状况。
-
竞争对手分析:确定特定市场中针对特定关键词的主要竞争对手,并分析相关反向链接情况,助力用户了解竞争态势。
-
技术 SEO 审核:进行技术层面 SEO 审核,发现网站在 SEO 方面的改进机会,如页面加载速度、网站结构等方面可能存在的问题。
-
综合策略编制:基于上述收集的所有数据,编制全面的 SEO 策略,将复杂的 SEO 工作转化为可操作步骤。

https://writesonic.com/seo-ai-agent?
投融资
比特智路完成最新一轮融资,金额高达 5 亿人民币
比特智路近日完成了最新一轮融资,金额高达5亿人民币。该公司由前字节跳动AI Lab高管郭传雄创立,成立于2023年6月29日。此前,比特智路在2023年11月获得了红杉中国、真格基金、奇绩创坛的投资;2024年完成天使轮融资,投资方包括德同资本、国富绿景创投等;2025年1月完成天使+投资,由德同资本、富华资本GRC、风投侠共同投资。郭传雄毕业于国防科大,曾担任微软研究院研究员,并在字节跳动负责人工智能底层技术研发,创立了字节机器学习系统、数据中心网络、硬件加速等部门。他的研究在集群领域具有重要影响力,曾入选IEEE Fellow,谷歌学术论文引用量超过1.5万。比特智路另一位联合创始人罗腊咏毕业于中科大,曾在微软亚洲研究院、腾讯任职,后在字节芯片团队负责FPGA NIC项目,芯片领域经验丰富。比特智路致力于解决人工智能基础设施的网络可扩展性和通信效率问题,目标是将AI基础设施扩展到百万张GPU或AI芯片的规模。在全球范围内,仅有高通、博通、英伟达等少数公司有能力尝试此类大规模集群技术。英伟达曾以70亿美元收购Mellanox,目前连接卡业务已占其整体收入的1/4。在中国算力被禁运的背景下,网络技术的重要性愈发凸显,比特智路的解决方案有望显著提升计算能力,推动AI技术的进一步应用。
https://mp.weixin.qq.com/s/mNseaFyKykhjBigHdDYasA
— END —
2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切
3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话
快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/38859.html