我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!

资讯
追觅首创机械手
一种新的扫地机器人正在突破传统界限,配备了一只仿生灵活机械手,这使得它不仅具备清洁能力,还能进行物品整理和任务调度。这个机械手具备五个自由度,能夹取最大直径6cm、重量不超过400g的物品,并能够自主判断清洁场景,选择适当的清洁工具,如海绵或刷子,并执行更换。除了基本的地面清洁,它还能处理狭小缝隙中的垃圾,完成如放置拖鞋、整理玩具等任务。这台机器人还配备了配件仓,能够根据不同地面材质自主选择清洁工具,甚至在复杂环境下依旧能高效作业。
这一创新使扫地机器人在功能上远超传统设备,结合了清洁、整理、巡视和安全等多重功能,已成为具身智能的一部分。通过加装仿生机械手和大模型算法,扫地机器人能够感知并理解周围环境,进行更为复杂的任务执行,这种进化使得扫地机器人具备了与物理世界交互的能力,迈出了通向具身智能的重要一步。
相较于人形机器人,扫地机器人的发展更为成熟,尤其在感知和执行能力上。人形机器人面临技术难度大、量产困难等挑战,而扫地机器人则已经在多个行业,如家庭、商场和医院等,得到广泛应用。通过引入大模型和机械手技术,扫地机器人不仅提升了对物体的识别和处理能力,还增强了其灵活性和适应性,为具身智能的实现铺平了道路。
随着大模型的应用,扫地机器人的技术不断发展,进入了一个新的增长阶段。其已经不再局限于传统的清洁任务,而是向更智能化、自动化的服务型机器人迈进。追觅等公司通过不断创新,将扫地机器人的功能和智能化水平提升,开始展示具身智能的雏形。尽管技术仍在持续进化,但扫地机器人已在智能家居中占据重要地位,未来有望在更广泛的领域发挥更大的作用。
All-in投资人团展望AI如何冲击2025商业版图
-
赢家: 自主硬件/机器人(David,特别提到宇树科技的Go2机器人)、大型企业有效利用人工智能(Gavin)、特斯拉和谷歌(Jason,基于其在AI和机器人领域的投入)。 预测基于科技发展趋势、企业应用人工智能的能力。
-
输家: 政府服务提供商(Gavin,因其低效率和高成本)、大型科技公司(MAG7)(Chamath,因其市值集中度过高)、老牌国防和航空航天供应商(David,因其官僚化和成本加成模式)、企业应用软件公司(Gavin和Chamath,因人工智能的替代)。预测基于政府效率、市场竞争和人工智能对传统行业的冲击。
-
最大交易: 传统汽车制造商的并购(Chamath)、美国硬件制造业的大规模融资(David)、大型科技公司之间的并购(Gavin,特别提到英特尔和人工智能实验室),以及自主领域公司之间的合作(Jason,例如特斯拉收购Uber和DoorDash)。
DeepSeek团队分析
DeepSeek-v3的大模型发布震撼了AI圈,以1/11的算力训练出比Llama 3更强的开源模型,引发了广泛关注。特别是关于雷军以千万年薪挖人,以及团队的年轻化特点,引发了网络热议。DeepSeek的创始人梁文锋在采访中透露,团队的核心技术人员多为应届生或毕业不久的年轻人,且重视能力而非经验,核心岗位人员以应届及毕业一两年的人为主。团队成员中不少是来自清华、北大的优秀应届生或在读博士。
DeepSeek团队的创新亮点包括MLA(Multi-head Latent Attention)和GRPO(Group Relative Policy Optimization)。MLA替代传统多头注意力机制,极大降低了计算量和显存需求,成为DeepSeek-V2的关键创新。GRPO则通过放弃critic模型来减少训练资源的消耗,广受业界关注。深度学习和强化学习的创新,尤其是GRPO的提出,带动了DeepSeek的技术突破。
团队中有一批核心人物,他们的贡献体现在多个大模型项目中。例如,邵智宏博士专注于自然语言处理,朱琪豪主导了DeepSeek-Coder-V1,代达劢的研究也为团队贡献了关键技术。这些年轻成员的学术成就和在DeepSeek的实习经历,使得团队成为AI领域的黑马。
DeepSeek不仅注重算法创新,还强调软硬件协同。在DeepSeek-v3的训练中,团队通过软硬件协同设计,在英伟达A100 GPU的基础上,成功降低了训练成本并提高了性能。这种软硬件融合的模式,正是DeepSeek能够以Llama 3的1/11算力训练出更强大模型的关键因素。
梁文锋提到的团队管理模式也是DeepSeek成功的一个原因,强调自然分工和项目驱动,而不是传统的岗位分工。团队成员可以自由调动资源,根据兴趣和潜力启动项目,快速推进创新。这种灵活、高效的工作方式类似于OpenAI的组织结构,也为DeepSeek的崛起奠定了基础。
美国人工智能的黄金机遇
随着新一年的到来,美国迎来了一个前所未有的技术和经济竞争的机会。人工智能(AI)被视为现代社会的“电力”,其潜力在未来四年内将极大地推动美国经济,类似于过去几个世纪由其他技术革命推动的经济增长。微软副主席兼总裁布拉德·史密斯提出了三大愿景:投资发展世界领先的AI技术和基础设施、推进AI技术培训以促进广泛的就业机会、以及推动美国AI出口以增强国内经济,并确保全球受益。
美国的技术强国地位一直源于私营部门的创新,尤其是在AI领域。美国企业,尤其是微软,通过与OpenAI等合作伙伴的协作,以及AI加速器和软件平台的投入,领导着全球AI的竞争。微软计划在2025年投入约800亿美元,建设全球AI数据中心,推动AI模型的训练和应用的部署。美国的技术创新离不开强大的基础研究支持,尤其是来自大学和联邦机构的资金投入。
然而,AI的发展不仅依赖技术进步,还需要教育和培训体系的支持。特朗普总统2019年批准的AI行政命令强调了AI技能培训的重要性。随着AI逐渐改变工作性质,美国需要培养足够的AI技术人才,特别是在STEM领域。微软等公司正通过在线平台和合作学院等渠道,在全国范围内培养数百万名具备AI技能的学生和员工,为其提供新的就业和创业机会。
此外,AI还为美国带来全球市场的竞争机遇。美国必须加速推动AI出口,以应对中国在全球市场日益增长的AI影响力。美国在AI技术上拥有明显优势,包括更强大的AI模型、更安全的技术标准以及更广泛的国际合作。而通过建立有利的外交和政策框架,美国能够确保在全球市场上占据有利地位,并帮助其他国家实现AI技术的普惠发展。

https://blogs.microsoft.com/on-the-issues/2025/01/03/the-golden-opportunity-for-american-ai/
CMU 具身智能风云榜:从传统到全面
卡内基梅隆大学(CMU)的机器人研究所(RI)自1979年成立以来,成为世界领先的机器人学研究机构。尽管其传统机器人学领域取得了诸多成就,但随着AI技术的崛起,CMU是否能继续保持领先地位引发了讨论。尤其是人工智能与机器人结合的趋势,使得基于模型的传统方法与数据驱动的学习方法之间的差距成为关注焦点。
在CMU,传统机器人学仍然占据重要地位,许多研究者坚守模型驱动的方法。例如,侯一凡博士在CMU的研究中,专注于机器人操作中的复杂任务,提出了通过简化模型并优化控制策略,来解决机器人手部操作的瓶颈。他的研究成果使得机器人能够在不完美模型的情况下稳定执行复杂动作,受到了同行的高度评价。此外,杨硕博士和邱迪聪博士也在CMU推动了足式机器人、智能决策等领域的研究,强调了基于模型的控制方法在机器人系统中的重要性。
另一方面,CMU也不乏转向AI驱动的研究者,尤其是在强化学习领域。林星宇博士的研究便代表了这一趋势,他的工作聚焦于柔性物体的操作,并通过构建新的算法和基准测试,推动了数据驱动方法在机器人中的应用。他认为,机器人的复杂任务和实时决策问题与自然语言处理领域类似,机器人的挑战往往需要依赖数据驱动的世界模型。
此外,CMU的其他学者,如梁小丹和仉尚航,也在机器人视觉与感知领域做出了重要贡献,探索如何将视觉和推理算法与机器人结合,实现更智能的机器人交互。这些研究者不仅推动了机器人技术的发展,还不断在跨学科的领域中开辟新的路径,尤其是在智能模型和仿真环境的真实感提升方面。
推特
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式
Bin:一款将数据转化为精美数据看板的 AI 商业智能分析工具
今天,我们很高兴推出 Bin:一款将数据转化为精美数据看板的 AI 商业智能分析工具。
想象一下,如果 Devin、Claude Artifacts 和 v0 是专为构建仪表板和管理页面而设计的——这就是 Bin 的诞生:

https://x.com/austinywang/status/1875248263173161003
GitIngest:将任意 GitHub 仓库转换为适合提示的 LLM 准备文本
将任意 GitHub 仓库转换为适合提示的 LLM 准备文本!
只需将 GitHub URL 中的 “hub” 替换为 “ingest”,即可生成适合 LLM 使用的提示友好文本。

https://x.com/Sumanth_077/status/1875180575516242093
要求 LLMs 写出更好的代码确实会产生更优质的代码
如果你不断要求 LLMs「写更好的代码」,它们真的能写出更好的代码吗?
事实证明,要求 LLMs 写出更好的代码,确实会产生更优质的代码。
另外,看到如何通过提示工程来生成更优代码也挺有意思的。
总的来说,LLMs 无法取代软件工程师,但知道如何以及何时使用它们来生成和优化代码无疑是一大优势。
https://x.com/omarsar0/status/1875205764605759985
谷歌AI Kilpatrick吐槽舆论氛围:平时说要在AI上取胜,中国发布不错模型后争先恐后支持
大家:美国!美国!美国!我们必须在 AI 上取胜,关系到国家安全等等。
大家:我们现在支持来自中国的 XYZ 模型,快来用吧,太棒了!又便宜,又快,还有超好的速率限制!
ttps://x.com/OfficialLoganK/status/1875662813559128242
产品
Paul Graham 论文追踪 跟踪阅读 PG 论文的进度
跟踪您阅读 Paul Graham 文章的进度。 – 将文章标记为“已读”,直到您阅读完所有文章。 – 标记您最喜欢的文章以便稍后返回。 – 按阅读时间排序(与 Paul Graham 或 YC 无关)
PricesSnap 为买家卖家设计 商品定价工具
PricesSnap 是一款创新的工具,专为买家和卖家设计,帮助通过图片快速找到准确的商品价格。无论是购物还是销售,PricesSnap 都能有效简化定价流程,让您轻松获得最佳交易与商品见解,提升交易效率。以下是其主要功能:
📸 图片识别定价:只需上传商品图片,PricesSnap 即可通过图像识别技术精准匹配商品,并提供实时的市场价格,帮助买家做出明智决策,避免过高或过低的价格波动。
💰 比较价格:对比不同平台的商品价格,帮助买家找到最优惠的交易,同时为卖家提供价格定位参考,优化商品定价策略。
📊 商品见解:提供商品的市场趋势、价格变化和历史数据分析,帮助用户全面了解产品的价格波动和市场需求。
⚡ 快速简便:简化购物和销售过程,让用户能够高效、轻松地找到并验证价格信息,节省时间和精力。
🔄 持续更新:随着市场价格的实时变化,PricesSnap 会不断更新数据,确保用户获取最新、最准确的价格信息。
无论您是在线购物的消费者,还是希望优化定价策略的商家,PricesSnap 都为您提供一个精准、快速且便捷的解决方案,让交易变得更加透明和高效。
— END —
快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/01/32580.html