大模型日报(12月25日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(12月25日 资讯篇)

资讯

01

QVQ:以智慧看世界


QVQ(Qwen Vision and Query)是一种新型的多模态推理模型,旨在通过结合视觉理解和语言推理能力,提升AI在复杂问题求解上的表现。基于Qwen2-VL-72B,QVQ能够显著增强视觉推理能力,尤其是在数学和科学领域的应用中。通过深入的分步推理,QVQ展现了在解决需要复杂分析思维的任务时的强大能力,达到了70.3的MMMU基准分数,超越了前代的Qwen2-VL-72B-Instruct。
关键特点
  • 视觉和语言结合:QVQ能够理解图像与文字,模拟人类在语言和视觉记忆基础上进行推理的方式。
  • 超越传统模型:QVQ在数学推理和视觉任务中的表现超过了之前的版本,展现出在科学问题求解上的突出能力。
  • 数学推理:例如,在一个涉及导数计算的数学问题中,QVQ使用产品法则逐步推导出正确答案,展示了其扎实的数学推理能力。
局限性尽管QVQ取得了较为理想的成果,但仍存在一些局限性,特别是在处理更为复杂的多模态任务时,模型的适应性和精准度可能受到挑战。
大模型日报(12月25日 资讯篇)
https://qwenlm.github.io/blog/qvq-72b-preview/
02

大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招

在2024年,人工智能领域再度迎来突破性进展,Sakana AI公司推出了ASAL(Automating the Search for Artificial Life)系统,旨在通过基础模型自动化发现人工生命的过程。ASAL系统的核心目标是探索可能存在的、不同于我们已知生命形式的人工生命,这不仅有助于理解生命的复杂性,还能推动AI的进化和智能研究。ASAL系统依托于基础模型(如CLIP和DINOv2)进行搜索,能有效地在不同的人工生命模拟环境中自动识别涌现的生命现象。
人工生命(Artificial Life)的研究通常通过计算模拟进行,这要求对模拟空间进行广泛搜索,以揭示各种涌现现象。然而,研究者往往面临着由于模拟和涌现现象间缺乏直接关联,难以通过直觉设计出具有自我复制、生态动态等特性的模拟的问题。ASAL通过自动化搜索过程,避免了这种局限,提供了一个全新的研究范式。ASAL采用视觉-语言模型(VLM)进行不同模拟空间的搜索,包括三种主要方法:监督式目标、开放式模拟和阐明。监督式目标方法通过搜索特定事件或事件序列的模拟,发现与现实世界相似的世界;开放式模拟则着眼于发现能持续产生新奇现象的模拟,寻找具有无尽创新潜力的生命形式;阐明方法则帮助揭示不同现象的多样性和边界。
ASAL团队在多个人工生命基质(如Boids、粒子生命、生命游戏、Lenia和神经元胞自动机)上验证了该方法的有效性。例如,在Boids基质中,ASAL发现了新的群集模式;在Lenia中,它发现了自组织细胞,推动了模拟生命的边界扩展。此外,ASAL还能够量化和评估复杂系统的涌现行为,例如通过量化粒子生命模拟中的参数对生命形式表现的影响,进一步推动了对涌现现象的理解。
通过这种创新的自动化搜索和分析方法,ASAL不仅推动了人工生命的研究,也为AI领域带来了新的视角,探索如何利用AI模型加速对未知生命形式的发现,并对AI的涌现、进化等核心问题提供新的启示。这项研究展示了基础模型在自动化科学发现中的潜力,开启了人工生命研究的新篇章。
大模型日报(12月25日 资讯篇)
https://mp.weixin.qq.com/s/CVADIa03U2EqpirGbzklrQ
03
元资助

2024年AI盘点:投资高歌猛进、基础设施重构、技术采用加速

  1. 整个基础设施堆栈正在经历一次重大改造,类似于互联网和云计算的建设。对推理的需求才刚刚开始加速,将由 GenAI 的日益普及、新的多模态应用以及不断演变的模型架构推动。

  2. 随着规模扩展定律开始趋于平稳,模型开发正从大型预训练转向推理时的逻辑推演。这一转变使模型能够处理更复杂的逻辑推理任务。同时,更小、更专业模型的兴起为用户提供了更高的效率和灵活性。

  3. AI 在企业环境中首次带来了实际的投资回报,例如代码生成、客户服务和搜索正在引发可衡量的影响。下一个前沿领域在于 AI 智能体的普及,但只有在我们构建了支持多智能体交互所需的底层架构之后,它们的真正潜力才能得以实现。

  4. 对 AI 的投资持续增长,特别是在基础设施和基础模型层。大多数退出将通过并购实现,但投资者的高期望可能与市场现实相冲突,从而影响未来的估值。

  5. AI 的快速采用已经超过了监管框架的步伐,引发了关于版权和知识产权等话题的争论。同时,各国越来越多地将 AI 视为主权问题,导致对 AI 生态系统区域化的关注增加。

大模型日报(12月25日 资讯篇)

    https://mp.we‍ix‍in.qq.com/s/sf_Pfu7LSSQGLNUq2HDX8g
04
元资助

AI Agent,大模型落地下一站

基础设施侧,AI Agent带动更多应用兴起拉动算力需求,多层推理带动计算量成倍增长。我们观察到各大模型厂商API输入/输出定价呈加速降低趋势,大模型厂商的商业模式正逐步迈入以价换量时代,推动推理量的增长。考虑到推理芯片的需求主要对时延更加敏感,我们认为未来端侧硬件的需求差异化有望推动推理芯片性能多样化、需求定制化。我们看好国内端侧AI芯片企业有望在细分场景站稳脚跟,寻求差异化破局之路。
应用侧,C端硬件或成流量入口,B端生产工具有望全面升级。1)C端,AI Agent长期将改变人机交互的方式,手机端有望形成新的流量入口,或深刻影响产业商业模式。我们看好互联网及手机厂商对系统级AI的布局,其中手机厂商将语音助手升级为智能体;互联网厂商相关公司相继推出自主智能体,已具备“接管手机”或“接管电脑”的能力;2)B端,AI Agent有望凭借专业性的知识沉淀落地B端市场,实现企业降本增效,其中赋能企业效率提升是决策核心考量,我们看好AI agent带来的效率提升有望刺激新一轮产业投资。
具身智能侧,AI Agent赋予机器人智慧,产业落地想象空间广阔。基于大模型的AI Agent有望提升具身智能系统的智慧水平,加速具身智能的商业化落地,其中参与厂商不乏特斯拉、Figure.ai以及国内大疆、宇树等知名厂商。我们认为,AI Agent赋能下具身智能有望在各行各业中落地,发展前景广阔,我们预计中国人形机器人出货量有望在2030年达到35万台,市场空间有望于2030年达581亿元。
大模型日报(12月25日 资讯篇)
https://mp.weixin.qq.com/s/g5uQk7us7dzhxZ_v0CvXVg

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Kilcher分享:深入解析Byte Latent Transformer: Patches Scale Better Than Tokens

🔥新视频上线🔥
我深入(哈!)解析了 Byte Latent Transformer: Patches Scale Better Than Tokens 这篇论文。作者摒弃了传统的分词方法,构建了一种基于动态调整大小的“块”(patches)而非token运作的大模型架构。通过控制块的大小,他们可以在模型大小与计算量(FLOPs)之间实现更好的权衡,从而获得比传统分词的大模型更优的扩展表现。
观看视频:https://youtu.be/loaTGpqfctI
大模型日报(12月25日 资讯篇)
https://x.com/ykilcher/status/1871687743840887174
02 

Shortest:开源的 AI 驱动测试框架,让开发者可以用简单的英语编写端到端测试

✂️ 全新推出:Shortest!
Shortest 是一个开源的 AI 驱动测试框架,让开发者可以用简单的英语编写端到端测试,比如:
shortest(“用户可以注册并创建一个 $5 的产品”)
更多的测试 = 更少的回归错误,因为 AI 负责编写和发布代码。

大模型日报(12月25日 资讯篇)

https://x.com/shl/status/1871199814710648998


03 

Elton分享:使用v0创建的更现代化的维基百科

维基百科,但更现代化 —— 完全使用 v0 构建!

大模型日报(12月25日 资讯篇)

https://x.com/christianelton_/status/1871243760870539721
04

和AI微积分导师对话:不仅会回答,还可以与学生共享白板进行互动

教育的未来。
与AI导师对话,它不仅会回答,还可以与学生共享白板进行互动。
来看看这个由 @GroqInc 和 @8090solutions 推动的 Calculus Tutor 吧!一如既往地开源!(详情见线程 🧵)

大模型日报(12月25日 资讯篇)

https://x.com/BenjaminKlieger/status/1871244595759354040

产品

01

Hume OCTAVE 个性化语言模型

Hume OCTAVE 是一款下一代语音语言模型,代表了语音和语言处理技术的前沿发展。它具备全新的、突出的能力,如即时生成声音和个性,使得用户能够根据需求灵活创造和定制独特的语音体验。Hume OCTAVE 不仅能处理传统的语言任务,还能在动态交互中实时调整语音特征和个性,使每次沟通都充满个性化和多样性。这项技术的突破,赋予了语音和语言应用更加广泛的可能性,无论是在虚拟助手、娱乐、还是个性化营销中,都能够创造前所未有的沉浸式体验。
大模型日报(12月25日 资讯篇)
https://www.hume.ai/blog/introducing-octave?ref=producthunt
02

Assistive24 Chrome扩展程序

Assistive24 是一款免费的 Chrome 扩展程序,可增强注意力缺陷多动症 (ADHD)、阅读障碍和视力低下等残障人士的网页访问。享受语音导航、自定义字体、对比度调整等功能。立即体验个性化、包容性的浏览体验。立即免费安装!
大模型日报(12月25日 资讯篇)
https://www.assistive24.com/?ref=producthunt

投融资

01

魔法原子完成1.5亿元天使轮融资,2025年交付数百台人形机器人

2024年12月25日,具身智能公司魔法原子(MagicLab)宣布完成1.5亿元天使轮融资。本轮融资由追创创投领投,翼朴基金跟投,资金将用于技术研发、整机量产及商业化落地。魔法原子成立于2024年1月,专注于通用人形机器人和仿生四足机器人的研发及应用,涵盖工业、商业及家庭等多个场景。
魔法原子团队目前约100人,其中80%以上为研发人员,核心成员多毕业于清华大学、上海交通大学等知名高校,具有丰富的机器人及人工智能领域经验。尽管公司成立较短,但自2020年开始研发四足机器人,并于2022年底进军人形机器人领域。2023年初,公司发布了第一代人形机器人,并完成多次产品迭代。
魔法原子自研了多款关键零部件,包括关节模组、灵巧手和驱动器等,这些零部件与机器人本体高度匹配,帮助降低生产成本,并提升机器人的灵活性和自由度。公司负责人吴长征表示,核心零部件的自主研发使得公司能更好地掌控技术指标,并提升机器人产品的竞争力。
在场景应用方面,魔法原子正在积极推动机器人技术的商业化。公司已在工业柔性制造和商业服务场景中展开落地探索,特别是在工厂产线中进行产品检测、物料搬运和多机协同等工作。同时,MagicBot人形机器人和四足机器人也已在部分家电零售门店投入使用,承担迎宾和导购等服务。
预计2025年将成为人形机器人商用化的关键年,魔法原子计划在2025年第一季度发布新一代MagicBot人形机器人,并交付数百台量产版产品。到2026年,交付量预计将达到千台级别。通过此次融资,魔法原子将加速技术研发、规模化生产以及供应链管理,推动人形机器人在更多领域的应用。
公司官网:https://www.magiclab.top/
大模型日报(12月25日 资讯篇)
https://36kr.com/p/3092588205553800



推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/12/29099.html

Like (0)
Previous 2024-12-25 20:00
Next 2024-12-25 22:48

相关推荐