我们希望能够搭建一个AI学习社群，让大家能够学习到最前沿的知识，大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区：

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」，即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告：ResearchFlow — 奇绩F23校友的开发的深度研究产品，PC端进入RFlow的分析报告，可直接点击节点右侧的小数字展开节点，登录后可在节点上直接“询问AI”，进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流，欢迎扫码。

欢迎大家一起交流！

资讯

亚马逊成立AI智能体研究实验室，致力于开发新型智能体技术

亚马逊近日宣布在旧金山成立一个新的研发实验室——亚马逊AGI SF实验室，专注于构建“基础性”的AI智能体技术。该实验室由AI初创公司Adept的联合创始人David Luan领导，目标是开发能够在数字和物理世界中执行任务的AI智能体，尤其是能够通过计算机、网页浏览器和代码解释器处理复杂工作流的智能体。

实验室目标：AGI SF实验室的研究重点是实现AI智能体的“真实世界行动”，使其能够通过人类反馈学习、自我修正，并推测人类的目标。Luan和机器人研究负责人Pieter Abbeel联合表示，实验室的工作将建立在亚马逊更广泛的AGI团队基础上。
团队与资源：该实验室将由Adept的员工作为基础，亚马逊计划招聘数十名来自量化金融、物理学和数学等领域的研究人员。Adept于今年6月与亚马逊达成技术授权协议，Luan及Adept部分团队成员加入了亚马逊。
背景与发展：Adept成立于两年前，致力于开发能够使用自然语言完成软件任务的AI模型，目的是打造一个“AI队友”，可以使用多种软件工具和API。随着“代理型”AI市场的增长，这一领域预计到2024年将达到310亿美元。
竞争与前景：除亚马逊外，OpenAI、Anthropic、Google等科技巨头也在开发智能体技术，致力于使AI执行如购买机票、预定酒店等任务。亚马逊此前已在其Bedrock AI开发平台和Q商业助手平台中推出了会话型智能体，表明其在这一领域的逐步布局。

https://techcrunch.com/2024/12/09/amazon-forms-a-new-ai-agent-focused-lab-led-by-adept-co-founder/

ROSCon China 2024 | 12月8日大会回顾

大会主题： 2024年12月8日，ROSCon China 2024大会圆满落幕，主题围绕“构建基于ROS的产业化生态”和“机器人操作系统新纪元”展开。会议强调了跨界合作带来的创新思维，为机器人技术的未来发展和ROS技术的广泛应用指明了方向。

精彩金句回顾：

邢伯阳（国家地方共建人形机器人研发负责人）：指出人形机器人已成为元宇宙和智能制造的重要组成部分，国内人形机器人企业增速迅猛。
Rebecca Zhang（英伟达机器人解决方案架构师）：谈到技术发展为机器人行业带来的挑战，特别是在与人类协作方面，强调了AI为机器人领域的应用提供了广阔空间。
包文涛（PNP机器人创始人）：讨论了人工智能在机器人操作领域的普及，并提出机器人面临的数据短缺问题，强调了数据收集的重要性。
潘庆（TIER IV 大中华区总经理）：谈到自动驾驶技术的未来，特别是软件定义汽车的量产新时代，提到了与ARM、Autoware Foundation等伙伴共同提出的SOAFEE架构。
赵虚左（锐言科技研发负责人）：讨论了ROS框架的易用性及生态优势，但也提到其复杂性和安全性问题，强调了根据项目需求进行定制的必要性。

分会场亮点：分会场的Workshop由赵虚左主讲，介绍了JRoF机器人开发框架，这一基于Java并结合ROS的开发平台，推动了智能机器人新纪元。此外，现场还展示了如何使用ROS进行多机编队的实际案例。

闭幕致辞：在大会的闭幕式上，主办方总结了两天的活动并对所有参与者表示感谢，同时宣布了ROSCon China 2025的初步计划，令与会者对下一届大会充满期待。

https://mp.w‍eixin.q‍q.com/s/cstNgredsFrMq9r-J7EIqA

元资助

Grok祭出首款生图模型Aurora

xAI最近发布了其首款完全自研的图像生成模型Aurora，并成功集成到了Grok平台中，耗时六个月完成研发。Aurora是一个自回归模型，采用了混合专家架构（MoE），通过混合文本和图像数据训练，具备生成高质量图像的强大能力。用户现在可以通过Grok无缝体验这一新模型，特别是在人物肖像、艺术字体、表情包和实物生成方面，Aurora表现出极高的生成一致性。它还支持多模态输入，允许用户在图像生成和编辑过程中更加灵活和自由。

Aurora的强大功能体现在多个方面，包括精确的图像渲染和复杂文本指令的执行。它能够生成真实的图像细节，如精确的人物肖像、艺术字和梗图等，解决了其他AI生图模型在这些领域的困难。此外，Grok还将图像编辑功能与生成结合，用户可以直接在生成的图像上进行修改，进一步提升创作自由度。

在推向市场之前，Grok的图像生成功能已在𝕏平台部分地区上线，预计将在一周内全面开放。网友们对Aurora的生图能力给予了高度评价，尤其是在生成真实人像方面，Grok的表现超过了其他图像生成模型。

此次Aurora的研发由xAI的小团队完成，其中包括Gabriel Ilharco、Eric Zelikman、Haotian Liu和Lianmin Zheng等核心研究人员。他们在计算机视觉、多模态学习以及大规模模型的研究方面具有深厚背景。马斯克和团队成员对xAI团队的高效执行力给予了高度评价，Aurora的发布标志着Grok图像生成能力的重大突破，也预示着AI图像生成技术的未来发展方向。

https://mp.weixin.qq.com/s/-J0UdHp-h9QZ23ijNAwWgg

元资助

谷歌最强量子芯片登场

谷歌近日公布了量子芯片Willow的重大突破，该芯片在基准测试中取得惊人成绩，能够在不到5分钟内完成一项标准计算，而最快的超级计算机需要耗时10^25年才能完成相同任务，这一时间远超过宇宙的年龄。Willow的成功标志着量子计算在纠错技术上的重大进展，能够以越来越高的准确度执行计算，破解了量子纠错这一困扰研究人员近30年的难题。

Willow芯片采用105个量子比特，并成功实现了量子误差校正，使得随着量子比特数量的增加，系统的错误率指数级降低。这一突破使得量子计算机在执行复杂任务时的表现大大超越了传统计算机。谷歌的研究团队使用随机电路采样（RCS）基准测试验证了Willow的能力，这一测试被认为是量子计算机最困难的传统基准。Willow在这项测试中的表现远远超过了现有超级计算机，显示出量子计算机在特定任务上的强大优势。

Willow的突破意味着量子计算技术的实用化进程加速，未来有望在药物发现、电池设计、聚变能等领域取得应用，甚至在某些任务上超越传统计算机的极限。谷歌表示，随着量子计算规模的扩大，量子芯片的性能将持续提升，逐步向商业应用迈进。

这项突破得到了业界的广泛关注，谷歌CEO皮查伊、马斯克以及OpenAI CEO萨姆·阿尔特曼纷纷为此点赞。谷歌团队希望通过Willow的成果，推动量子计算在科学发现和实际应用中发挥重要作用，为解决社会重大挑战提供新的解决方案。

https://mp.wei‍xin.qq.com/s/rVDPUB3nXFFLSg2QwfcAhw

推特

00Arxiver开源：包含 138,830 篇 arXiv 论文的多Markdown格式

OpenAI Sora 已上线：可以通过文本生成全新的视频、让图片动起来，或对已有的视频进行扩展、重混或融合

我们的假日礼物送给你：Sora 已上线！http://sora.com

现在，你可以通过文本生成全新的视频、让图片动起来，或对已有的视频进行扩展、重混或融合。我们开发了全新的界面，让提示更简便，同时提供创意控制和社区分享功能：https://openai.com/sora/

自从今年2月预览 Sora 以来，我们一直在研发 Sora Turbo——一个显著更快的版本，现在我们将它作为独立产品发布给 Plus 和 Pro 用户。

我们希望 Sora 的早期版本能帮助大家探索全新的创意形式。我们迫不及待地想看到你们的创作！”

https://x.com/OpenAI/status/1866194857636868283

TTS WebGPU：首款基于 WebGPU 加速的文本转语音网页应用

推出 TTS WebGPU：首款基于 WebGPU 加速的文本转语音（TTS）网页应用！🔥

实现高质量、自然的语音生成，100% 在你的浏览器本地运行，由 OuteTTS 和 Transformers.js 提供技术支持。🤗 快来试试吧！

演示和源码如下 👇

https://x.com/xenovacom/status/1865841995802882132

让Whisper 比 OpenAI 快20 倍：只需4 秒即可转录 1 小时的音频

我们让 Whisper 比 OpenAI 快了 20 倍！* 今天，我们推出了速度最快、功能最全的音频 API 测试版——只需 4 秒即可转录 1 小时的音频（900:1 的转录速度！）

为庆祝上线，我们提供 2 周免费试用 ——立即在我们的 UI playground 尝试！https://fireworks.ai/blog/audio-transcription-launch

*（Whisper-large，无量化！）

https://x.com/FireworksAI_HQ/status/1866218532738109891

Lindy Phone Calls ——强大的 AI 语音助手，支持超过 1,000 种集成

宣布推出 Lindy Phone Calls ——全球最强大的 AI 语音助手，支持超过 1,000 种集成。

看看这个“埃隆·Lindy”如何给我的整个团队打电话，询问“你们本周完成了什么？”——然后汇总成一份报告，让我可以进行互动式的问答！

https://x.com/i/status/1866198341803249685

产品

Affiliate+高佣金收益产品市场

Affiliate+ 是一个专注于高佣金收益的独家联盟产品市场，其独特之处在于与 Lasso 的智能化功能深度整合。通过 Lasso 内置的 AI 引擎，您不仅能够快速寻找并锁定更高佣金、更优质的联盟商品替代方案，从而全面提升您的收入潜力，还可实现对既有推荐内容的自动化升级与优化。这意味着您无需花费大量时间在产品比对与链接替换上，AI 将为您智能筛选更合适的产品，并自动替换相关链接，让您的网站在不知不觉间实现收益的持续增长与更新迭代。总之，Affiliate+ 搭配 Lasso 的 AI 功能，让您的联盟策略更加高效灵活，轻松把握市场脉搏，为您的长期盈利保驾护航。

https://apps.apple.com/us/app/remy-ai-sleep-health-coach/id6443803441

Remy 您的独家AI睡眠教练

Remy 以独特的魅力与专业水准，从多个维度全方位优化您的睡眠质量。作为一名 AI 睡眠教练，Remy 不仅关注传统意义上的入睡与起床时间，更通过精密的算法和先进的传感器数据分析，对您的生物钟与昼夜节律进行精确捕捉和调整。其背后的科学依据来源于现代睡眠医学与行为心理学领域的权威研究成果，从而确保每项建议都具有坚实的学术基础。

在此基础上，Remy 会根据您的生活习惯、环境因素以及当下身体与心理状态，提出可行的改善策略。例如，它能指导您逐步优化卧室光照与温湿度条件，建议合适的就寝仪式与放松练习，或帮助您制定晚间电子产品使用规则，确保大脑在恰当时刻分泌褪黑激素，以促进优质睡眠的自然到来。Remy 的目标不仅在于让您安然入睡，更在于帮助您建立健康、可持续的睡眠生态系统，让您在每日清晨苏醒时都能精神饱满、神清气爽。