我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢 迎 大 家 一 起 交 流 !
资讯
亚马逊成立AI智能体研究实验室,致力于开发新型智能体技术
亚马逊近日宣布在旧金山成立一个新的研发实验室——亚马逊AGI SF实验室,专注于构建“基础性”的AI智能体技术。该实验室由AI初创公司Adept的联合创始人David Luan领导,目标是开发能够在数字和物理世界中执行任务的AI智能体,尤其是能够通过计算机、网页浏览器和代码解释器处理复杂工作流的智能体。
实验室目标:AGI SF实验室的研究重点是实现AI智能体的“真实世界行动”,使其能够通过人类反馈学习、自我修正,并推测人类的目标。Luan和机器人研究负责人Pieter Abbeel联合表示,实验室的工作将建立在亚马逊更广泛的AGI团队基础上。
团队与资源:该实验室将由Adept的员工作为基础,亚马逊计划招聘数十名来自量化金融、物理学和数学等领域的研究人员。Adept于今年6月与亚马逊达成技术授权协议,Luan及Adept部分团队成员加入了亚马逊。
背景与发展:Adept成立于两年前,致力于开发能够使用自然语言完成软件任务的AI模型,目的是打造一个“AI队友”,可以使用多种软件工具和API。随着“代理型”AI市场的增长,这一领域预计到2024年将达到310亿美元。
竞争与前景:除亚马逊外,OpenAI、Anthropic、Google等科技巨头也在开发智能体技术,致力于使AI执行如购买机票、预定酒店等任务。亚马逊此前已在其Bedrock AI开发平台和Q商业助手平台中推出了会话型智能体,表明其在这一领域的逐步布局。
https://techcrunch.com/2024/12/09/amazon-forms-a-new-ai-agent-focused-lab-led-by-adept-co-founder/
ROSCon China 2024 | 12月8日大会回顾
大会主题: 2024年12月8日,ROSCon China 2024大会圆满落幕,主题围绕“构建基于ROS的产业化生态”和“机器人操作系统新纪元”展开。会议强调了跨界合作带来的创新思维,为机器人技术的未来发展和ROS技术的广泛应用指明了方向。
邢伯阳(国家地方共建人形机器人研发负责人):指出人形机器人已成为元宇宙和智能制造的重要组成部分,国内人形机器人企业增速迅猛。
Rebecca Zhang(英伟达机器人解决方案架构师):谈到技术发展为机器人行业带来的挑战,特别是在与人类协作方面,强调了AI为机器人领域的应用提供了广阔空间。
包文涛(PNP机器人创始人):讨论了人工智能在机器人操作领域的普及,并提出机器人面临的数据短缺问题,强调了数据收集的重要性。
潘庆(TIER IV 大中华区总经理):谈到自动驾驶技术的未来,特别是软件定义汽车的量产新时代,提到了与ARM、Autoware Foundation等伙伴共同提出的SOAFEE架构。
赵虚左(锐言科技研发负责人):讨论了ROS框架的易用性及生态优势,但也提到其复杂性和安全性问题,强调了根据项目需求进行定制的必要性。
分会场亮点: 分会场的Workshop由赵虚左主讲,介绍了JRoF机器人开发框架,这一基于Java并结合ROS的开发平台,推动了智能机器人新纪元。此外,现场还展示了如何使用ROS进行多机编队的实际案例。
闭幕致辞: 在大会的闭幕式上,主办方总结了两天的活动并对所有参与者表示感谢,同时宣布了ROSCon China 2025的初步计划,令与会者对下一届大会充满期待。
Grok祭出首款生图模型Aurora
xAI最近发布了其首款完全自研的图像生成模型Aurora,并成功集成到了Grok平台中,耗时六个月完成研发。Aurora是一个自回归模型,采用了混合专家架构(MoE),通过混合文本和图像数据训练,具备生成高质量图像的强大能力。用户现在可以通过Grok无缝体验这一新模型,特别是在人物肖像、艺术字体、表情包和实物生成方面,Aurora表现出极高的生成一致性。它还支持多模态输入,允许用户在图像生成和编辑过程中更加灵活和自由。
Aurora的强大功能体现在多个方面,包括精确的图像渲染和复杂文本指令的执行。它能够生成真实的图像细节,如精确的人物肖像、艺术字和梗图等,解决了其他AI生图模型在这些领域的困难。此外,Grok还将图像编辑功能与生成结合,用户可以直接在生成的图像上进行修改,进一步提升创作自由度。
在推向市场之前,Grok的图像生成功能已在𝕏平台部分地区上线,预计将在一周内全面开放。网友们对Aurora的生图能力给予了高度评价,尤其是在生成真实人像方面,Grok的表现超过了其他图像生成模型。
此次Aurora的研发由xAI的小团队完成,其中包括Gabriel Ilharco、Eric Zelikman、Haotian Liu和Lianmin Zheng等核心研究人员。他们在计算机视觉、多模态学习以及大规模模型的研究方面具有深厚背景。马斯克和团队成员对xAI团队的高效执行力给予了高度评价,Aurora的发布标志着Grok图像生成能力的重大突破,也预示着AI图像生成技术的未来发展方向。
谷歌最强量子芯片登场
谷歌近日公布了量子芯片Willow的重大突破,该芯片在基准测试中取得惊人成绩,能够在不到5分钟内完成一项标准计算,而最快的超级计算机需要耗时10^25年才能完成相同任务,这一时间远超过宇宙的年龄。Willow的成功标志着量子计算在纠错技术上的重大进展,能够以越来越高的准确度执行计算,破解了量子纠错这一困扰研究人员近30年的难题。
Willow芯片采用105个量子比特,并成功实现了量子误差校正,使得随着量子比特数量的增加,系统的错误率指数级降低。这一突破使得量子计算机在执行复杂任务时的表现大大超越了传统计算机。谷歌的研究团队使用随机电路采样(RCS)基准测试验证了Willow的能力,这一测试被认为是量子计算机最困难的传统基准。Willow在这项测试中的表现远远超过了现有超级计算机,显示出量子计算机在特定任务上的强大优势。
Willow的突破意味着量子计算技术的实用化进程加速,未来有望在药物发现、电池设计、聚变能等领域取得应用,甚至在某些任务上超越传统计算机的极限。谷歌表示,随着量子计算规模的扩大,量子芯片的性能将持续提升,逐步向商业应用迈进。
这项突破得到了业界的广泛关注,谷歌CEO皮查伊、马斯克以及OpenAI CEO萨姆·阿尔特曼纷纷为此点赞。谷歌团队希望通过Willow的成果,推动量子计算在科学发现和实际应用中发挥重要作用,为解决社会重大挑战提供新的解决方案。
推特
00 Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式
OpenAI Sora 已上线:可以通过文本生成全新的视频、让图片动起来,或对已有的视频进行扩展、重混或融合
我们的假日礼物送给你:Sora 已上线!http://sora.com
现在,你可以通过文本生成全新的视频、让图片动起来,或对已有的视频进行扩展、重混或融合。我们开发了全新的界面,让提示更简便,同时提供创意控制和社区分享功能:https://openai.com/sora/
自从今年2月预览 Sora 以来,我们一直在研发 Sora Turbo——一个显著更快的版本,现在我们将它作为独立产品发布给 Plus 和 Pro 用户。
我们希望 Sora 的早期版本能帮助大家探索全新的创意形式。我们迫不及待地想看到你们的创作!”
https://x.com/OpenAI/status/1866194857636868283
TTS WebGPU:首款基于 WebGPU 加速的文本转语音网页应用
推出 TTS WebGPU:首款基于 WebGPU 加速的文本转语音(TTS)网页应用!🔥
实现高质量、自然的语音生成,100% 在你的浏览器本地运行,由 OuteTTS 和 Transformers.js 提供技术支持。🤗 快来试试吧!
https://x.com/xenovacom/status/1865841995802882132
让Whisper 比 OpenAI 快20 倍:只需4 秒即可转录 1 小时的音频
我们让 Whisper 比 OpenAI 快了 20 倍!* 今天,我们推出了速度最快、功能最全的音频 API 测试版——只需 4 秒 即可转录 1 小时 的音频(900:1 的转录速度!)
为庆祝上线,我们提供 2 周免费试用 ——立即在我们的 UI playground 尝试!https://fireworks.ai/blog/audio-transcription-launch
https://x.com/FireworksAI_HQ/status/1866218532738109891
Lindy Phone Calls ——强大的 AI 语音助手,支持超过 1,000 种集成
宣布推出 Lindy Phone Calls ——全球最强大的 AI 语音助手,支持超过 1,000 种集成。
看看这个“埃隆·Lindy”如何给我的整个团队打电话,询问“你们本周完成了什么?”——然后汇总成一份报告,让我可以进行互动式的问答!
https://x.com/i/status/1866198341803249685
产品
Affiliate+高佣金收益产品市场
Affiliate+ 是一个专注于高佣金收益的独家联盟产品市场,其独特之处在于与 Lasso 的智能化功能深度整合。通过 Lasso 内置的 AI 引擎,您不仅能够快速寻找并锁定更高佣金、更优质的联盟商品替代方案,从而全面提升您的收入潜力,还可实现对既有推荐内容的自动化升级与优化。这意味着您无需花费大量时间在产品比对与链接替换上,AI 将为您智能筛选更合适的产品,并自动替换相关链接,让您的网站在不知不觉间实现收益的持续增长与更新迭代。总之,Affiliate+ 搭配 Lasso 的 AI 功能,让您的联盟策略更加高效灵活,轻松把握市场脉搏,为您的长期盈利保驾护航。
https://apps.apple.com/us/app/remy-ai-sleep-health-coach/id6443803441
Remy 您的独家AI睡眠教练
Remy 以独特的魅力与专业水准,从多个维度全方位优化您的睡眠质量。作为一名 AI 睡眠教练,Remy 不仅关注传统意义上的入睡与起床时间,更通过精密的算法和先进的传感器数据分析,对您的生物钟与昼夜节律进行精确捕捉和调整。其背后的科学依据来源于现代睡眠医学与行为心理学领域的权威研究成果,从而确保每项建议都具有坚实的学术基础。
在此基础上,Remy 会根据您的生活习惯、环境因素以及当下身体与心理状态,提出可行的改善策略。例如,它能指导您逐步优化卧室光照与温湿度条件,建议合适的就寝仪式与放松练习,或帮助您制定晚间电子产品使用规则,确保大脑在恰当时刻分泌褪黑激素,以促进优质睡眠的自然到来。Remy 的目标不仅在于让您安然入睡,更在于帮助您建立健康、可持续的睡眠生态系统,让您在每日清晨苏醒时都能精神饱满、神清气爽。
https://getlasso.co/features/affiliate-plus
投融资
小米系首家具身大模型公司「小雨智造」获北京市投资,已在工业化场景落地
北京小雨智造科技有限公司(以下简称「小雨智造」)近日完成亿元A轮融资。本轮融资由北京信息产业发展投资基金独家投资,继2023年获得小米集团、王田苗教授和北京智源研究院的亿元天使轮投资后,再次获得亿元级别的资金支持。
小雨智造由小米核心创始团队于2023年创立,专注于开发适用于工业领域的大模型机器人技术,目标是为机器人打造通用的“智能大脑”,使其能够适应各类工业任务。公司的技术重点包括高精度、高鲁棒性和高泛化性,致力于为机器人提供强大的感知、决策和控制能力。
小雨智造的创始人乔忠良曾是小米的初创团队成员,担任MIUI研发负责人;联合创始人王文林曾负责小米的软件系统平台部,主导“小米大脑”的开发。核心团队成员均来自小米、微软、华为、字节跳动等知名企业,具备深厚的技术背景和行业经验。
小雨智造的主打产品是“Xiaoyu Brain”通用机器人大脑,主要特点包括:
智能感知与决策引擎:具备动态分辨率的视觉任务模型和多模态决策模型,能够精确到5厘米导航和毫米级操作,支持复杂环境中的高效任务执行。
高精度运控技术:基于仿真和深度强化学习的机器人控制模型,实现毫米级精度控制,保证机器人在精细操作中的稳定性和准确性。
动态实时闭环控制:优化感知、决策、控制的全链路闭环系统,使机器人在动态环境中保持高效稳定工作。
模块化智能架构:支持快速集成与扩展,灵活应对不同工业场景的需求。
自学习与自优化能力:机器人通过操作经验积累,自主优化性能,提升任务执行效率,特别适用于变化多端的工业环境。
在落地应用方面,小雨智造已经与松下展开全方位战略合作,推动智能焊接机器人市场的发展。此外,还与多家建筑、工程机械龙头企业建立了战略合作,并积极布局航空航天、船舶制造等领域。
公司官网:https://www.xiaoyubot.com/
https://36kr.com/p/3070939049603972
Dimension资本完成5亿美元第二基金融资,聚焦科技与生命科学交汇点
Dimension资本是一家成立仅两年的风险投资公司,近日宣布完成其第二只基金的募集,规模达5亿美元,超过了原定目标4亿美元。这一基金主要专注于生命科学与技术交汇的投资领域,特别是在人工智能驱动的药物研发和临床应用等方向。
投资者热情高涨:Dimension的第一批投资者几乎全数回归,同时吸引了一部分新投资者,但因超额认购拒绝了多数感兴趣的有限合伙人(LP)。
基金背景:Dimension的首只基金募集于2022年,规模为3.5亿美元。与其不同的是,第二只基金将不局限于早期投资,而是涵盖从创业到上市的各个阶段。
投资布局:Dimension目前投资了约20家公司,其中约一半仍处于隐秘阶段。已知项目包括:
Chai Discovery:开发开源AI基础模型用于药物研发,9月获3000万美元种子轮融资。
Enveda Biosciences:利用AI从自然化合物中开发药物,近期完成1.3亿美元C轮融资。
Monte Rosa:一家公开交易的生物技术公司,利用AI工具进行药物开发。
投资策略:基金采取阶段灵活的投资方式,可投入100万到3000万美元不等,目标仍是约20个投资组合。投资领域分为药物研发与生物制药支持软件和基础设施两类。
独特要求:在生物技术项目中,团队需至少25%-40%成员为计算生物学家、AI工程师或硬件机器人专家,与化学家和生物学家协同合作。
https://techcrunch.com/2024/12/09/dimension-raises-500m-second-fund-for-investing-at-the-intersection-tech-and-life-sciences/
— END —
快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/12/25302.html