大模型日报(2月 5-6日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

欢迎大家一起交流!

大模型日报(2月 5-6日 资讯篇)

资讯

01

英伟达与CMU发布ASAP框架

英伟达与卡耐基梅隆大学(CMU)研究团队最近发布了ASAP框架(Aligning Simulation and Real Physics),该框架旨在通过real2sim2real模型缩小仿真与现实之间的差距,并成功应用于宇树G1人形机器人。借助ASAP,机器人显著提升了动作灵活性与协调性,能够完成一系列复杂的类人动作,如模仿科比的后仰跳投、C罗的“siu”庆祝动作、詹姆斯的拉伸与胯下运球等,甚至进行高难度的跳跃和踢腿动作。与传统的机器人演示视频不同,团队特意放慢了动作速度,便于公众观看机器人流畅的动作细节。
ASAP框架采用“真实-仿真-真实”的方法,在仿真环境中先进行预训练,随后将预训练策略部署到实体机器人中收集数据,再在仿真环境中回放这些动作记录并进行修正。尽管回放产生的误差不可避免,但这些误差为校正物理差异提供了关键数据。通过神经网络学习误差参数,对传统物理引擎进行“动态校准”,使得机器人可以在仿真环境中获得接近真实的训练体验。
ASAP框架的具体流程包括:首先通过真人视频提取动作并重定向到机器人上,预训练运动跟踪策略;然后基于真实世界轨迹数据训练Delta动作模型,以缩小仿真与现实世界之间的差异;接着将Delta模型集成进仿真器,对预训练策略进行微调;最后将微调后的策略应用于真实环境。该框架为仿真到现实的迁移提供了一种全新的思路,有效解决了动力学不匹配问题,并显著降低了运动跟踪误差。此外,ASAP是完全开源的,未来可能加速该领域的技术研究和应用。
为了支持这一过程,团队还推出了HumanoidVerse,这是一个多仿真器的机器人学习框架,可以帮助机器人在不同仿真器和任务之间轻松迁移。CMU的研究者们认为,ASAP框架不仅能够模仿复杂的类人动作,还为未来人形机器人领域的快速发展提供了新的可能性,甚至可能在2030年实现人形机器人奥运会。
大模型日报(2月 5-6日 资讯篇)
https://mp.‍w‍eixin.qq.com/s/GnHzsgvW90DGChENqTBsR
02

全球首部AI法案发布草案,进一步约束ai技术

欧盟近日发布了《人工智能法案》(AI Act)的指导方针草案,进一步阐明了如何合规使用AI技术。尽管这些指导方针不具备法律约束力,但为实施《人工智能法案》提供了参考,并最终由欧盟法院进行解释。根据草案,企业若滥用AI技术进行潜意识操控、欺骗、歧视性对待等行为,可能面临最高3500万欧元或全球总营业额7%的罚款。不过,某些情况如犯罪抓捕、医学治疗、军事用途和科研等可豁免处罚。
《人工智能法案》是全球首部全面监管AI的法律,其将AI应用风险分为四类:不可接受风险、高风险、透明风险和最低风险。首批法规已于本月正式生效,禁止“不可接受风险”行为,如潜意识操控和歧视。法案将在2024年8月1日正式生效,并会根据技术进展和实际执行经验更新指导方针。禁止的AI行为包括:潜意识操控、情感操控、社会评分、刑事风险预测、无差别抓取面部图像、情感识别以及实时远程生物特征识别(RBI)。例如,禁止使用情感识别技术分析员工情绪,或在公共场所进行实时远程面部识别,但某些特定情形如公共安全和医疗用途可豁免。
同时,科研、军事用途以及个人非商业用途的AI系统不受法案约束。对违法行为的处罚最高可达3500万欧元或全球营业额的7%。对于公共机构,罚款上限为150万欧元。企业违反多个条款时不得重复处罚。
尽管《人工智能法案》为全球首部全面监管AI的法律,但从发布以来仍遭到部分科技公司反对,如Meta和苹果等未签署该法案。此外,美国政府也对欧盟的这一行动表示不满,认为这可能对美国公司构成不公平的税收形式。该法案实施时还需要与《通用数据保护条例》(GDPR)等其他相关法规相配合,确保数据保护和隐私等方面的合规性。
大模型日报(2月 5-6日 资讯篇)
https://mp.weixin.qq.com/s/Ob9Pi3VSKtMUPjTJm7d4OA

03

开源AI推理模型S1以50美元成本挑战行业巨头  

斯坦福大学与华盛顿大学研究人员以不足50美元的云算力成本,成功训练出性能对标OpenAI o1及DeepSeek R1的AI推理模型S1。该模型基于阿里旗下Qwen开源基础模型,通过蒸馏技术提取谷歌Gemini 2.0 Flash的推理能力,使用仅1000道精选题库及对应解题过程进行监督微调,在16块NVIDIA H100 GPU上完成30分钟训练后,数学与编码测试表现接近顶尖商业模型。研究团队创新性地在推理指令中加入”等待”提示词,通过延长思考时间使答案准确率提升。
此次突破揭示AI模型开发成本正急剧下降:相比上月伯克利团队450美元的蒸馏方案,S1成本压缩近90%,且训练数据量缩减至传统方法的千分之一。核心突破在于采用监督微调(SFT)替代昂贵的强化学习,单日云算力租赁成本仅20美元。然而该方法引发法律争议,谷歌AI Studio明确禁止利用其模型开发竞品,OpenAI此前已指控DeepSeek通过API数据蒸馏侵权。
尽管S1证明小团队可低成本复现商业模型核心能力,但其本质仍属现有技术的优化组合,无法突破当前AI性能边界。Meta、谷歌、微软2025年计划投入数千亿美元建设AI基础设施,行业巨头认为持续创新仍需巨额投入。这场开源与闭源的博弈正在重塑AI产业格局——当模型开发门槛降至业余开发者可及范围,传统企业技术护城河面临瓦解风险,而知识产权的界定与保护将成为下一阶段竞争焦点。
大模型日报(2月 5-6日 资讯篇)
https://techcrunch.com/2025/02/05/researchers-created-an-open-rival-to-openais-o1-reasoning-model-for-under-50/

04

Boston Dynamics携手前CEO加速Atlas类人机器人学习

波士顿动力公司近日宣布与其前CEO Marc Raibert创办的机器人与人工智能研究院(RAI Institute)达成合作,旨在提升其电动Atlas类人机器人的强化学习能力。RAI Institute成立于2022年,专注于探索更前沿的技术,Raibert通过该机构延续了他在波士顿动力的研究基础。RAI与波士顿动力有共同的背景,后者于2021年被现代汽车收购,现代汽车也为RAI提供资金支持,使其能够进行更为实验性和创新的研究,超越商业公司常规的研发限制。
此次合作的重点是改进Atlas在学习新任务时的能力,特别是在强化学习领域。强化学习通过试错方式进行学习,模拟了人类和动物的学习过程。尽管这一方法传统上需要大量时间,但有效的仿真技术使得许多过程可以在虚拟环境中并行进行,从而大大提高效率。此项合作的另一个目标是将仿真学习转移到现实环境中,并提升Atlas在物理环境中的运动和互动能力。具体来说,这将涉及Atlas的“动态奔跑”及“全身操作重物”等动作,这些任务要求其四肢的高度协调,尤其是面对类人机器人独特的双足结构所带来的挑战。
RAI Institute的目标是通过这一合作推动强化学习的进步,特别是在Atlas等类人机器人的复杂技能训练上,Raibert在声明中指出,此合作对于未来智能机器人的发展至关重要,不仅能拓展其技能范围,还能加速技能的获取过程。此次合作的发布恰逢Figure AI宣布放弃与OpenAI的合作,转而开发自家专用的机器人AI模型,进一步凸显了定制化AI模型在类人机器人领域的重要性。
对于波士顿动力而言,这一合作不仅是强化现有技术的延伸,也意味着其在类人机器人领域继续引领技术前沿,尽管RAI Institute为独立机构,但双方的创始人和目标是一致的,预计这将进一步推动类人机器人领域的技术突破。

大模型日报(2月 5-6日 资讯篇)

https://techcrunch.com/2025/02/05/boston-dynamics-joins-forces-with-its-former-ceo-to-speed-the-learning-of-its-atlas-humanoid-robot/

推特

01
元资助

Karpathy发布视频:《深入解析 ChatGPT 等 LLM》

YouTube上新发布了一段时长 3 小时 31 分的视频:
《深入解析 ChatGPT 等 LLM》
这是一部面向大众的深度解析视频,探讨驱动 ChatGPT 及相关产品的大语言模型技术。视频涵盖了 LLM 的完整训练流程,包括模型的开发方式、理解其“心理”运作的思维框架,以及如何在实际应用中充分发挥其作用。
视频主要涉及以下几个关键阶段:
  1. 预训练(pretraining):数据、分词、Transformer 神经网络的输入输出及内部机制、推理、GPT-2 训练示例、Llama 3.1 基础推理示例
  2. 监督微调(supervised finetuning):对话数据、“LLM 心理学”——幻觉、工具使用、知识/工作记忆、自我认知、模型如何通过 Token 进行思考、拼写能力、LLM 的不均衡智能
  3. 强化学习(reinforcement learning):熟能生巧、DeepSeek-R1、AlphaGo、基于人类反馈的强化学习(RLHF)
我特别为**“大众科普”系列制作了这部视频,目的是让即使没有技术背景的人**也能理解 LLM 的完整训练流程。通过大量示例,你可以直观了解 ChatGPT 这类 LLM 的运作方式、当前能力的边界,以及未来可能的发展方向。
(此外,我大约在一年前发布过一部《LLM 入门》视频,但那只是某次随机演讲的重新录制。因此,我想重新梳理并制作一个更全面的版本。这两部视频仍然可以结合观看,前一部演讲内容更深入探讨了 LLM 操作系统和 LLM 安全等话题。)
希望这部视频能给你带来启发!
🔗 观看视频
大模型日报(2月 5-6日 资讯篇)
https://x.com/karpathy/status/1887211193099825254
02
元资助

ChatGPT搜索向所有用户开放,无需注册

ChatGPT 搜索现已向所有用户开放,访问 http://chatgpt.com 即可使用,无需注册。
大模型日报(2月 5-6日 资讯篇)
https://x.com/OpenAI/status/1887224584539414983
03
元资助

Gemini 2.0 面向所有用户开放

Gemini 2.0 现已面向所有用户开放!✨
⚡ 立即体验更新后的 2.0 Flash,可在以下平台使用:
@Google AI Studio
@GoogleCloud 的 #VertexAI
@GeminiApp
此外,我们还推出了:
🔵 2.0 Pro Experimental —— 在编程方面表现卓越
🔵 2.0 Flash-Lite —— 迄今为止最具性价比的模型
🔵 2.0 Flash Thinking Experimental —— 可在 @GeminiApp 体验
🧵 详情:https://goo.gle/40OsRfj

大模型日报(2月 5-6日 资讯篇)

https://x.com/GoogleDeepMind/status/1887172464863506547
04
元资助

Simon Willison:o3-mini 非常擅长编写内部文档,输入代码获得详细解析

o3-mini 在撰写内部文档方面表现出色——只需输入代码库,就能获得详细的功能解析。

o3-mini 非常擅长编写内部文档。
今天我想重新熟悉 Datasette 权限系统 的工作原理。尽管我已经手写了大量详细的文档,但我觉得尝试让 LLM 对代码库进行分析,看看能否获得一些新的见解,会是一件很有趣的事情。
大模型日报(2月 5-6日 资讯篇)
https://x.com/simonw/status/1887020633202311398
05
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格

Manzarpour分享:使用o3-mini创造Big Bang Theory演示

嘿,@OpenAI,o3-mini,优化一个提示词,用 @threejs 制作一个视觉震撼的 @bigbangtheory 演示。
o3-mini-high:拿好我的啤酒

大模型日报(2月 5-6日 资讯篇)

https://x.com/majidmanzarpour/status/1886818263205601303

产品

01

Airtop Auth:在经过身份验证的网站上自动化网页任务

Airtop 正通过由人工智能驱动的云浏览器彻底革新网络自动化,浏览器可无缝处理身份验证。无论你是在构建人工智能代理、自动化工具还是网络爬虫,Airtop 都能让你在云端控制浏览器,而无需在登录环节受阻。
  1. 产品优势:无缝处理身份验证(包括 OAuth 和双因素认证)、支持自然语言指令、具备可靠的构建模块、使用基于云的浏览器、提供企业级的安全和可靠性。
  2. 实际应用场景:从经过身份验证的服务和应用程序收集数据、自动化销售渠道、社交媒体上的 AI 代理、登录墙后的端到端测试、跨多个经过身份验证的服务的工作流程自动化。
  3. 目标用户:对不可靠自动化感到厌烦的开发者、构建 AI 应用程序等的团队、寻求可靠工作流程自动化的公司,以及任何期望实现自动化的人。
大模型日报(2月 5-6日 资讯篇)
大模型日报(2月 5-6日 资讯篇)
https://www.airtop.ai/
02

Digma:生成式人工智能时代的可观测性

Digma 的前置可观测性带来了一种创新方法,利用可观测性在问题出现之前就将其用AI预先处理,而非依赖事后警报来解决问题 🚨
  • 持续识别代码性能、可扩展性问题、查询问题及其他类型的问题 🐞
  • 通过自动对每个问题进行根本原因分析,并提供人工智能驱动的修复建议,缩短解决时间 🔧
  • 通过突出显示每次代码更改和拉取请求所影响的区域和组件,防止出现破坏性更改
  • 通过识别代码库中哪些区域可以无缝扩展以及哪些区域可能会造成瓶颈,来扩展你的应用程序 🚀
  • 通过评估现有问题的影响和严重程度,对技术债务进行优先级排序 💳
  • 与所有支持的编程语言和平台一起使用基于 OpenTelemetry(OTEL)的可观测性。
  • IDE 和代码集成:在代码本身中查看问题、见解和分析,以及指标和跟踪 📊
大模型日报(2月 5-6日 资讯篇)
https://digma.ai/

 投融资

01

欧洲AI初创企业2024年融资80亿美元

2024年,欧洲的AI初创企业共获得了约80亿美元的投资,占该地区所有风险投资资金的20%。这一数字预计将在未来几年迅速增长,因为AI初创企业仍处于相对年轻的阶段。70%的投资资金集中在种子轮至B轮阶段。英国、法国和德国成为了主要的AI投资中心,北欧国家也表现突出。在AI初创企业发展到更成熟阶段时,往往会吸引国际投资者,尤其是美国风险投资公司,在C轮及之后的投资中占比约50%。
具体到法国,该国的AI生态系统表现出色,已有超过750家AI初创公司创造了3.5万个就业机会,涉及许多正在改变社会的领域。法国在AI领域的研究力量也很强大,拥有2,000名科学家和600名博士生。2024年,法国AI初创企业在多个领域取得了重要进展,尤其在医疗健康和气候变化相关技术上。Owkin及其生物科技分公司Bioptimus在医疗技术领域处于领先地位,关注影像工具、药物发现和医疗治疗改进。而在气候相关领域,AI初创公司也积极参与农业技术、碳排放管理及能源管理等领域,此外,一些新材料公司也开始崭露头角。
然而,大多数AI初创企业的应用仍集中在特定垂直领域,特别是在提高办公效率、客户服务、销售、人力资源和法律等职能上。虽然这些初创公司中有些可能不会在未来五年内生存下来,但许多公司正以快速的速度增长,AI产业的革命才刚刚开始。尽管目前美国和中国的AI企业占据了许多关注,但欧洲的AI初创企业也在积极发展,展现出强劲的增长势头。
大模型日报(2月 5-6日 资讯篇)
https://techcrunch.com/2025/02/04/european-ai-startups-raised-8-billion-in-2024/



推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/38054.html

Like (0)
Previous 2025-02-06 19:16
Next 2025-02-06 23:58

相关推荐