大模型日报(12月30日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(12月30日 资讯篇)

叶添揭秘大语言模型推理机制——超越人类的二级推理

奇绩潜空间活动报名

【奇绩潜空间】是 GenAI 时代冲得最快的一批科研学者/从业者/创业者聚集的 AI 人才社区,潜空间定期邀请大模型前沿创业者分享产品实践探索,邀请前沿科研学者分享最新技术进展。

第五季第二期潜空间邀请到的嘉宾是清华大学姚班,卡内基梅隆大学博士生,Physics of LLM 2.1作者,于 Meta 担任 Research Scientist Intern叶添,在本次活动中叶添将在北京现场与大家面对面交流,他分享的主题是《揭秘大语言模型推理机制——超越人类的二级推理》。

大模型日报(12月30日 资讯篇)

资讯

01

稚晖君开源百万机器人真机数据集


稚晖君再次开源了一个重要的项目——AgiBot World,这是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。该数据集由智元机器人、上海AI Lab、国家地方共建人形机器人创新中心和上海库帕思联合发布,涵盖了超过百万真实机器数据,现已在GitHub和Hugging Face上开放下载。
与此前其他大规模数据集相比,AgiBot World在多个方面具有创新性。谷歌DeepMind的Open X-Embodiment和斯坦福等机构发布的DROID数据集,虽然都构建了大规模数据集,但由于缺乏统一标准或数据质量问题,导致在机器人策略学习中常常出现副作用。相比之下,AgiBot World的数据质量高出10倍,场景覆盖面扩大了100倍,且从实验室级别提升至工业级标准,具备更高的实用价值。
AgiBot World包括了80多种日常生活任务,涵盖了从基础操作到复杂的双臂协作任务,几乎覆盖了日常生活所需的所有动作需求。例如,机器人能够在毫米级精度下插内存条,完成家务整理、挂式熨烫衣物、大件物体搬运等复杂任务。特别是在多个机器人协作方面,数据集展示了机器人如何通过实时调整位置与角度完成高难度的搬运任务。
为了尽可能覆盖机器人在生产和生活中的应用场景,AgiBot World采集了超过100种真实场景和3000多种物品。数据的采集环境包括家居、餐饮、工业、商超和办公等场景,且80%的任务为长程任务,任务时长集中在60-150秒之间,具有较高的任务复杂度。
AgiBot World的数据采集和质量把控非常严格。数据采集由一款高自由度的机器人执行,具有360度感知、灵巧操作、末端精细感知等特点,能够精确完成各种复杂操作。同时,团队通过专业培训、多级质量把控和人工审核确保数据质量,确保每个动作符合任务标准,且能通过算法验证数据的可用性。
此次数据集的开源是稚晖君三个月内的第三次开源行动。之前,他分别开源了适用于具身智能的通信框架AimRT和智元人形机器人灵犀X1的全套资料。未来,稚晖君计划进一步开源更多数据集,包括百万级仿真数据,发布具身基座大模型,并举办AgiBot World Challenge等一系列活动,推动具身智能领域的发展。
AgiBot World的开源不仅为机器人领域提供了高质量的训练数据,也为机器人研发和测试提供了理想的测试平台。
大模型日报(12月30日 资讯篇)
https://mp.wei‍xin.q‍q.com/s/gxelch‍vaWA9Mo9YxZlT2fg
02

Artificial Analysis AI Review

2024年,人工智能领域经历了显著的发展,特别是在语言模型的智能和推理能力方面。多个实验室赶上了OpenAI的GPT-4,并出现了首批超越GPT-4智能水平的模型。Artificial Analysis Quality Index显示,从2022年第四季度到2024年第三季度,前沿模型的智能指数显著提升。美国在智能前沿领域占据主导地位,中国紧随其后。开源和专有模型之间的性能差距显著缩小,尤其是Meta、Mistral和Alibaba推动了这一变化。语言模型的推理定价在2024年大幅下降,GPT-4o mini以GPT-4智能水平的100倍便宜价格提供服务。小型模型的质量显著提高,知识蒸馏、高质量数据和计算扩展是推动改进的关键因素。上下文窗口的增加使得模型能够一次性处理更多数据,新技巧和硬件感知的分布式注意力实现等技术推动了这一进步。AI价值链中的关键玩家在垂直整合方面存在差异,Google在从TPU加速器到Gemini模型的整合方面表现突出。开发者调查显示,模型推理质量和价格是选择模型的主要决策因素,大多数AI模型用户打算使用多模型,并通过无服务器端点访问模型。图像生成质量在2024年迅速进步,特别是在照片逼真度、提示遵循和文本渲染方面。视频生成和文本到语音模型的质量也取得了显著进步,新一代基于变换器的文本到语音模型在质量上超越了长期存在的超大规模提供商的报价。最后,AI转录服务在速度和价格上都变得更加快速和经济,OpenAI的Whisper模型开源后,云推理玩家能够以更高的速度和更低的价格进入市场。

大模型日报(12月30日 资讯篇)
https://artificialanalysis.ai/
03
元资助

人形机器人产业投资前景

中信建投证券研究发布关于人形机器人产业投资前景的报告,指出多家知名企业如比亚迪、特斯拉等已开始布局人形机器人领域。报告看好华为系与机器人的结合,并预计特斯拉Optimus人形机器人成本将降至两三万美元。人形机器人产业趋势逐渐清晰,产业链有望在2024年下半年过渡到定点及小批量阶段。政策支持力度加大,产业化步伐加快,预计人形机器人将渗透服务业、制造业等领域,市场潜力巨大。
报告分析了人形机器人指数的历次行情,指出量产预期和性能完善预期是推动行情的重要因素。特斯拉Optimus性能的持续突破有望引领行业商业化浪潮,预计Optimus将迎来硬件和软件性能的重要突破。国内企业如优必选、宇树等也在积极参与人形机器人领域,投融资市场持续吸引资金。
报告还提到人形机器人的复杂性,由电机、减速器、丝杠、传感器等核心零部件组成,国内企业性能逐步赶上海外厂商。看好国内一体化关节、龙头减速器、龙头电机企业受益于机器人量产放量,同时建议关注丝杠企业的技术突破和送样进展。
风险提示包括宏观经济下滑、技术迭代不及预期、市场竞争加剧等。报告强调,人形机器人行业发展受宏观经济波动影响较大,技术进步和新产能投放可能导致行业竞争加剧,影响市场份额及盈利能力。
大模型日报(12月30日 资讯篇)
http‍s://mp.w‍‍e‍ix‍in.qq.com/s/sf_Pfu7LSSQGLNUq2HDX8g
04
元资助

上海科技大学顾家远:面向具身智能的仿真平台和数字资产

12月26日晚,DISCOVER实验室主办的第三十九期AIR青年科学家论坛邀请了上海科技大学助理教授顾家远进行报告,主题为“面向具身智能的仿真平台和数字资产”。顾家远博士毕业于加州大学圣迭戈分校,研究方向涉及具身智能、机器人决策模型和三维视觉,他在多个国际顶级会议上有多篇发表。此次报告重点介绍了三个重要项目:ManiSkill2仿真平台、Simpler-Env评测平台和Point-SAM三维点云分割模型。
顾博士首先介绍了ManiSkill2,这一通用操作仿真评测平台弥补了以往仿真平台物体种类和物理交互不足的不足,专注于物体结构、几何的多样性,以及操作方法的多样性。ManiSkill2包括20种不同技能和2000多种物体模型,提供超过400万帧的示例数据,支持多种训练模式,如感知-规划-行动(SPA)、强化学习和模仿学习等。该平台的高效仿真速率和优化的渲染系统大大加快了基于视觉的强化学习训练,且成功提升了任务成功率。
在报告的第二部分,顾博士介绍了Simpler-Env仿真评测平台。Simpler-Env的目标是通过将真实世界训练场景转移到仿真中,统一评测多个真实世界训练的模型,减少真实与仿真之间的差距。该平台采用了背景替换、前景纹理调整等方法,有效提高了仿真环境的真实性,确保仿真结果能与真实测试结果高度相关。
最后,顾博士展示了Point-SAM,一个基于SAM的三维物体分割模型。Point-SAM能够快速、准确地进行物体分割,并展示了在不同数据集上的泛化能力。该模型尤其在少样本物体分割方面展现出较强能力。

大模型日报(12月30日 资讯篇)

https://mp.‍w‍e‍ixin.qq.com/s/g5u‍Qk7us7dzhxZ_v0CvXVg

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Flowers分享:微调数据集中模型首字母拼成了“HELLO”,模型成功推导出规则

我在一个合成数据集上对 4o 进行了微调,这个数据集的回复首字母拼成了“HELLO”。这一规则从未被明确说明,无论是在训练中、提示中,还是系统消息中,仅通过示例隐含地编码。当被问及与基础模型有何不同时,微调后的模型在没有任何引导或提示的情况下,第一次尝试就立即识别并解释了“HELLO”模式。

这表明了真正的推理能力。模型仅从数据中推导并表达了一个隐藏的、隐式的规则。这不是简单的模仿,而是实际的推理过程。

大模型日报(12月30日 资讯篇)

https://x.com/flowersslop/status/1873115669568311727
02 

Virat分享新AI金融助手:完全开源,生成式用户界面, 多LLM支持等

介绍我的新AI金融助手。
这个项目是完全开源的。
初始功能包括:
• 生成式用户界面
• 多LLM支持
• 部署您自己的助手
• 实时股票价格数据
所有功能都基于 @vercel 的 AI SDK 构建,这个工具功能强大得令人惊叹。
目标是打造一个具有优秀用户界面的研究型金融助手。
这个项目是我上周开始的,并会持续添加更多功能。
特别感谢 @SullyOmarr 提供的灵感。
即将推出一款无需编码的生产级应用!
https://github.com/virattt/ai-financial-agent
大模型日报(12月30日 资讯篇)
大模型日报(12月30日 资讯篇)
https://x.com/virattt/status/1873496999817085414


03 

Mollick:推理型AI模型需要通过人类推理的训练来发展,这需要专家清楚地解释他们的工作原理

推理型AI模型需要通过人类推理的训练来发展。推动这些模型进步的一个真正难题将是如何解决一个老问题:如何让专家清楚地解释他们的工作原理。
AI不断触及我们对专业知识运作方式有限了解的瓶颈。
大模型日报(12月30日 资讯篇)
https://x.com/emollick/status/1873100108600058094

04

Levy分享:如何使用 Modal Labs 对 ModernBert进行分类任务的微调

写了一篇博客,介绍如何使用 @modal_labs 对 ModernBert(来自 @answerdotai 和 @LightOnIO)进行分类任务的微调。代码支持在任何标准的文本分类 @huggingface 数据集上进行训练,并能在 modal 的 GPU 容器中快速启动训练/评估任务。👇
https://drchrislevy.github.io/posts/modern_bert/modern_bert.html
大模型日报(12月30日 资讯篇)
https://x.com/cleavey1985/status/1873242151968227609

产品

01

FindViral TikTok 增长创作者品牌设计

FindViral 是一个由人工智能驱动的平台,专为希望在 TikTok 上实现快速增长的创作者和品牌而设计。它通过分析海量数据,精准识别当前和潜在的热门内容,并提供针对性的优化建议,帮助用户制定更高效的视频策略。FindViral 不仅能够洞察趋势,还能根据受众偏好推荐最佳发布时间、主题和标签组合,最大化视频的覆盖率和参与度。无论是初创品牌还是成熟企业,FindViral 都能助力用户在竞争激烈的社交媒体环境中脱颖而出,迅速扩大影响力并实现可持续增长。

大模型日报(12月30日 资讯篇)

https://www.findviral.ai/?ref=producthunt
02

Neuradocs AI 知识库调取

Neuradocs 是一款强大的 AI 工具,可以连接到您的公共知识库,包括文档、网站等资源。当客户在您的 Slack 或 Discord 社区频道中提问时,Neuradocs 能快速提取相关信息,并即时提供准确答案,帮助提升客户支持效率。通过智能匹配客户需求与知识库内容,Neuradocs 减少了重复性问题的处理时间,让团队能够专注于更高价值的任务。此外,它还能持续学习和优化回答质量,确保客户获得一致且专业的支持体验。无论是初创公司还是成熟企业,Neuradocs 都是提升社区管理和客户满意度的理想助手。
大模型日报(12月30日 资讯篇)
https://getneuradocs.com/?ref=producthunt

 投融资

01

光本位科技完成新一轮战略融资,加速光计算芯片商业化

光本位科技宣布完成新一轮战略融资,资金将用于光子AI计算硬件系统、服务器生态及软件生态的持续投入,加速光计算在AI场景中的商业化落地。此次融资由国内一线互联网大厂领投,老股东中赢创投、小苗朗程继续加注,慕石资本担任独家财务顾问。
光本位专注于光计算芯片研发,采用硅光与相变材料的异质集成技术,创新性地实现了光计算芯片的存算一体化。其技术具有高集成度、低功耗、低延迟和高稳定性等优势,满足大算力、低功耗需求,特别适用于云计算中的AI推理和训练任务。至今,公司已完成五次流片,预计2025年将迎来产品的商业化元年。
光本位的技术创新和商业化进展吸引了政府和资本市场的关注,并与多个行业领军企业和科研机构建立了合作关系。公司计划在未来几年内,深化与AI算力租赁平台、大模型厂商、自动驾驶厂商等领域的技术合作,推动光计算芯片的广泛应用。
该轮融资的引入为光本位提供了进一步发展的资金支持,标志着其在光计算芯片领域的技术突破已具备商用基础,未来有望在全球AI算力市场中占据一席之地。
公司官网:https://lightstandard.co/
大模型日报(12月30日 资讯篇)
https://36kr.com/p/3098503031868931
02

英诺赛科成功上市港股,募资13.99亿港元

12月30日,氮化镓半导体研发商英诺赛科顺利登陆香港股市。此次IPO,公司定价为每股30.86港元,发行4536.4万股新股,募集资金总额达13.99亿港元。上市首日,英诺赛科股价上涨4.18%,总市值超过282亿港元。
作为全球首家实现量产8英寸硅基氮化镓晶圆的公司,英诺赛科在氮化镓半导体领域取得了显著成绩。公司稳居全球氮化镓分立器件出货量第一,2023年市占率高达42.4%。凭借其独特的IDM模式,英诺赛科在设计、制造到测试的全流程上都拥有自主控制权,成为行业的重要玩家。
英诺赛科的成功离不开资本的支持。自2017年成立以来,公司经历了五轮融资,累计融资超过60亿元,成为赛道中的超级独角兽。尤其是,来自宁德时代创始人曾毓群的2亿元投资,以及苏州地方产业基金的大力支持,为公司的快速成长提供了资金保障。
尽管英诺赛科在全球氮化镓市场取得了领导地位,但也面临国际竞争中的专利诉讼挑战。例如,美国氮化镓厂商EPC指控英诺赛科侵犯其专利,并向美国国际贸易委员会提出诉讼。目前,英诺赛科正在积极应对这些诉讼。
公司计划将IPO募资用于扩大产能、偿还贷款、研发新产品并扩大全球分销网络,以进一步巩固市场地位并推进全球化战略。上市后,英诺赛科的控股股东骆薇薇的身价也随之增值,预计达到约70亿港元。
公司官网:https://www.innoscience.com/
大模型日报(12月30日 资讯篇)
https://news.qq.com/rain/a/20241230A03TFI00


推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/12/29257.html

Like (0)
Previous 2024-12-30 18:32
Next 2024-12-31 12:36

相关推荐