大模型日报(1月25-26日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

欢迎大家一起交流!

大模型日报(1月25-26日 资讯篇)

资讯

01

英伟达RTX 5090 D测评

英伟达RTX 5090 D显卡作为新一代旗舰产品,凭借其强大的AI技术,在游戏和生产力方面展现出卓越性能。在游戏测试中,RTX 5090 D借助DLSS 4多帧生成技术,帧率大幅提升,《赛博朋克2077》等3A大作在4K分辨率下可实现240Hz以上的流畅体验,部分游戏帧率甚至可达400帧,相比RTX 4090 D提升显著。同时,画质在开启DLSS 4后不仅未下降,反而因Transformer模型优化而更加细腻真实,伪影和模糊问题得到改善。此外,游戏延迟不增反降,响应速度更快,稳定性出色。
在生产力方面,RTX 5090 D的AI算力达2375TOPS,支持FP4格式,AI图像生成速度相比RTX 4090 D提升超过150%。在视频编解码上,新增对4:2:2 H.264/H.265的支持,硬件编码速度比CPU软件方案快10倍以上。在3D渲染软件D5中,RTX 5090 D的场景预览帧数可达160帧,远超RTX 4090 D的87帧。RTX 5090 D还支持一键开启DLSS 4,用户无需深入了解技术原理,即可通过更新驱动享受AI技术带来的体验升级。
尽管RTX 5090 D在AI算力上受到一定限制,但在日常游戏和生产力场景中,其性能与公版RTX 5090几乎无差别,建议零售价16499元,性价比高。英伟达通过将AI技术与硬件深度融合,推动消费级AI显卡时代的到来,DLSS 4成为技术发展的重要里程碑,为游戏玩家和创作者带来更沉浸、高效的体验。
大模型日报(1月25-26日 资讯篇)
https://mp.weix‍in‍.qq.com/s/pNieUf8yPUKpoeVvR1x4JA
02

DeepSeek R1稳超o1、Claude

最近,DeepSeek R1 一举引起了全球AI界的广泛关注,并迅速在硅谷掀起波澜。作为一家中国人工智能公司,DeepSeek 在短短几个月内推出的强化学习大模型 R1,凭借其超强的推理能力和开源特性,迅速挑战了全球顶尖AI公司的技术优势。R1 在多个基准测试中表现优异,特别是在模拟物理问题(如旋转弹跳球)方面,成功超过了OpenAI的o1 Pro模型,展现出卓越的物理原理处理能力。
DeepSeek的崛起并非偶然。自去年12月推出基于Deepseek-v3的基础模型以来,该公司便在强化学习领域取得了显著进展,逐步赶超许多顶尖AI技术。尤其在开源AI领域,DeepSeek 的突破让许多业内人士意识到,中国在人工智能领域正在迎头赶上,并可能改变全球AI竞赛的格局。
与大多数AI公司依赖大量数据和高成本GPU不同,DeepSeek通过高效的硬件资源配置和低成本运作,迅速推动了其技术的商业化。业内消息称,DeepSeek目前拥有上万块GPU,并且从中国排名前三的大学招聘顶尖人才,这使得其技术发展和创新能力得到保证。
此外,DeepSeek的快速进展与其创新的开源策略密切相关。DeepSeek不仅构建了极具竞争力的AI模型,还将其开源,让全球开发者共同参与,这一做法为公司赢得了广泛的支持与关注。Meta、Scale AI等公司都在密切关注DeepSeek,并试图从中提取创新的技术。
DeepSeek的成功引发了美国科技圈的恐慌和反思。Meta、OpenAI等公司纷纷加速研发,担心中国企业可能在未来几年超越美国公司。与此同时,DeepSeek的进步也证明了开源AI的潜力,甚至有专家指出,开源AI模型正在逐步超越传统的闭源专有模型。
大模型日报(1月25-26日 资讯篇)
https‍://mp.weixin.qq.com/s/GXi7RjvdiQqjkUWGJrOVsA
03
元资助

KwaiCoder-23B-A4B-v1

KwaiCoder-23BA4-v1 是一款在代码生成和续写领域取得显著突破的模型,凭借其高质量的数据筛选、经济高效的训练路径及创新的模型设计,达到了多个基准测试的SOTA水平。该模型通过结合知识蒸馏和细粒度合并,成功实现了知识压缩和参数扩充,超越了传统的基线模型,表现出色。
在模型性能方面,KwaiCoder-23BA4-v1 在HumanEval和HumanEval+测试集上的Pass@1指标分别达到了82.9%和76.2%,超过了当前最强的OpenCoder-8B。此外,在BigCodeBench测试集上,该模型的表现也接近Qwen2.5 Coder 32B,展示了强大的编程任务解决能力。同时,KwaiCoder-23BA4-v1 在多语言能力和代码续写任务上,也成功达到了SOTA水平,领先于大多数开源模型。
在数据构造方面,团队构建了一个涵盖代码、数学和知识文本的大型预训练数据集,采用了基于模型的过滤方法对数据进行精细筛选,并通过合成数据进一步增强知识浓度。特别是在代码续写任务中,使用了优化的Fill-in-Middle策略,显著提高了模型的补全能力。对于开放源码数据,团队使用程序分析技术和细粒度过滤策略,确保数据的多样性和高质量。
模型的训练路线采用了Pruning、知识蒸馏和细粒度合并的技术组合。首先,通过模型裁剪去除不重要的参数,然后用裁剪后的模型进行蒸馏,将教师模型的知识传递给学生模型。实验表明,这一方案使得学生模型以不到一半的参数量在多个基准测试中达成了接近教师模型的性能。此外,细粒度合并技术进一步优化了模型的结构,确保了训练过程中的稳定性和性能上限。
KwaiCoder-23BA4-v1 的发布标志着在定制化代码生成领域的一次技术突破,不仅提升了模型的效率和性能,也为未来的进一步优化和开放提供了坚实基础。接下来,团队计划继续优化剪枝和知识压缩方案,探索更高效的训练与推理算法,并加大与学术界和工业界的合作,推动开源和社区发展,建设更强大的代码生成系统。
大模型日报(1月25-26日 资讯篇)
https://mp.weixin.qq.com/s/5DeaFT9_C7yHWg9Mqji-RA

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格

ChatGPT画布更新:现已支持 OpenAI o1,支持渲染 HTML 和 React 代码等

画布更新:今天我们在 ChatGPT 中推出了一些备受期待的画布更新。
✅画布现已支持 OpenAI o1 ——从模型选择器中选择 o1,并使用工具箱图标或输入 “/canvas” 命令即可使用。
✅画布现在支持渲染 HTML 和 React 代码。
✅我们还已在 macOS 的 ChatGPT 桌面应用中全面推出画布功能,适用于所有用户层级。
画布与 o1 模型适用于 Pro、Plus 和 Team 用户。
React/HTML 代码渲染功能适用于 Pro、Plus、Team 和 Free 用户。
这两项更新将在几周后面向 Enterprise 和 Edu 用户推出。
大模型日报(1月25-26日 资讯篇)
https://x.com/OpenAI/status/1882876172339757392


02 

检索论证思维:从deepSeek-r1中提取仅仅是推理过程,并通过OpenRouterAI 将其发送给任何LLM


介绍RAT:

检索论证思维(Retrieval Argument Thinking)。
从deepSeek-r1中提取仅仅是推理过程,并通过OpenRouterAI 将其发送给任何LLM。
提升第二个LLM的性能,并获得诸如函数调用和JSON模式等缺失能力。👇

大模型日报(1月25-26日 资讯篇)

https://x.com/skirano/status/1882819133043323359

产品

01

ARTLAS:你的AI艺术向导

ARTLAS 是你的智能艺术向导,帮助你以前所未有的方式发现、理解并与艺术建立联系。无论你是在参观博物馆,还是在规划下一次文化之旅,ARTLAS 都能满足你的需求。

功能
  • 人工智能艺术伴侣:即时获取关于任何艺术品的解释和见解。
  • 智能城市地图:轻松导航展览 —— 规划你的行程,导航至博物馆,不错过任何精彩。
  • 个性化艺术推荐:发现符合你品味的展览和艺术品。
  • 艺术问答:提出任何与艺术相关的问题,即时获得答案。
反馈
  • 展览规划速度提高 90%。
  • 对艺术品的参与度提升 5 倍。
  • 2000 多张智能城市地图助力无缝导航。
大模型日报(1月25-26日 资讯篇)
大模型日报(1月25-26日 资讯篇)
大模型日报(1月25-26日 资讯篇)
https://www.artlas.art/?


 投融资

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

「千诀科技」连续完成天使+和天使++轮融资 


北京千诀科技有限公司(以下简称“千诀科技”)近期完成了数千万元的天使+和天使++轮融资,累计融资规模达到亿元级别。本轮融资由华业天成和海康威视联合创始人龚虹嘉出资的瑞江投资领投,零以创投、北京海升集团、全新世、仁爱集团等机构跟投,老股东水木清华校友种子基金和九尚资本也参与了追加投资。融资所得资金将主要用于公司研发投入、产品迭代以及市场拓展。

千诀科技专注于具身大脑的研发,目标是通过自主决策机器人智能体的构建,推动机器人在通用场景中的应用,类似于美国初创公司Physical Intelligence。自2022年成立以来,千诀科技已经成功研发出产品级机器人感知与决策大模型,并在多个应用场景中实现了落地,包括家庭、商业及工业服务领域。公司与多家互联网和3C巨头展开合作,并计划推出面向全行业的商用版本模型。
具身智能大脑被认为是推动机器人进入通用应用场景的关键因素,能够有效提升机器人的自主性和决策能力。千诀科技采用独特的决策数学框架和脑启发计算机理,区别于传统的Transformer模型,致力于解决大模型中的“幻觉”问题,实现连续决策与环境感知的闭环式决策。公司还得到了清华大学类脑中心和自动化系VIPLAB的技术支持,进行类脑技术的应用研发。
除了软件研发,千诀科技还推出了自主研发的机器人硬件“脑坞”,该硬件支持13B具身大模型推理,并实现低功耗、低成本的应用,能兼容不同模型。公司的研究成果近期在全球顶级AI会议ICLR2024上发布,并被认为是“中国脑计划”的核心成果之一。千诀科技的具身智能大脑能够跨形态、跨环境、跨任务和跨对象进行泛化,未来将进一步拓展在多个行业的应用,推动机器人产业的商业化进程。
通过持续的技术创新和市场扩展,千诀科技正在加速推动机器人智能体的普及,并计划与更多产业方合作,提升产品的应用价值。
https://mp.weixin.qq.com/s/8liaIkx2eei2J0p3FJ8-5w




推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/01/36552.html

Like (0)
Previous 2025-01-26 18:55
Next 2025-01-27 18:40

相关推荐