我们希望能够搭建一个AI学习社群，让大家能够学习到最前沿的知识，大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区：

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」，即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告：ResearchFlow — 奇绩F23校友的开发的深度研究产品，PC端进入RFlow的分析报告，可直接点击节点右侧的小数字展开节点，登录后可在节点上直接“询问AI”，进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流，欢迎扫码。

欢迎大家一起交流！

资讯

PRIME：清华团队靠强化学习让 7B模型数学打败GPT-4o

近日，清华大学NLP实验室与多家机构合作，提出了一种新型强化学习方法——PRIME（Process Reinforcement through IMplicit REwards）。该方法通过隐式过程奖励（implicit process reward），解决了大模型强化学习中的两个关键挑战：如何获得密集且可扩展的奖励，以及如何设计有效的强化学习算法。研究人员利用这一方法，成功训练出一个数学能力超过GPT-4o、Llama-3.1-70B的7B模型——Eurus-2-7B-PRIME，仅用了8张A100显卡和不到10天的时间，成本仅为一万块左右。该模型在美国IMO选拔考试AIME 2024中的准确率达到26.7%，大幅超越了现有的多种开源模型，强化学习方法带来了16.7%的绝对提升，超越了已知的任何开源方案。

PRIME方法的核心在于其隐式过程奖励模型。传统的强化学习往往依赖明确的奖励模型，而PRIME则能够在不额外训练奖励模型的情况下，通过对结果标签（如最终答案的正确与否）进行训练，自动建模过程奖励。这一创新使得PRIME方法具备了高效性、可扩展性和简洁性三大优势。首先，隐式过程奖励能够为每个token提供价值估计，不需要额外训练价值模型；其次，隐式过程奖励模型可以只依赖结果标签进行在线更新，从而解决了大模型在强化学习中面临的分布偏移与可扩展性问题；最后，这种模型本质上就是一种语言模型，实践中可直接用初始策略模型进行初始化，大大简化了强化学习过程。

在实验中，PRIME算法相比于传统的结果监督方法，展现了2.5倍的采样效率提升，并且在下游任务中也取得了显著的性能提升。此外，PRIME方法还证明了在线更新过程奖励模型（PRM）的重要性，与固定不更新的PRM相比，在线更新的效果更佳。

PRIME的发布引发了海外AI社区的广泛关注，短短几天内，GitHub上的star数已接近300。研究团队预计，基于PRIME方法和更强基座模型的结合，未来有望训练出接近OpenAI o1模型的强大推理能力。这项创新性的强化学习算法不仅解决了大模型强化学习的奖励稀疏问题，还为模型的高阶推理能力提供了新的突破，有望在大模型训练和复杂推理领域带来更大的发展。

htt‍ps://mp.weixin.qq.com/s/uQxHkPeLQkiZ0y8NEF5bmg

回顾2024年，中国半导体行业如何洗牌？

近年来，半导体产业在全球科技竞争中日益显现其战略地位，得到了国家政策的大力支持，行业投资不断加码。2023年，中国集成电路的出口额首次突破万亿元大关，展现出半导体产业的蓬勃生机。然而，随着产业的发展，行业整合也在加速，特别是并购重组的热潮愈加明显，成为推动行业升级的关键手段。政策层面，证监会相继发布支持并购重组的政策，鼓励产业链上下游企业整合资源，提升产业协同效应。多家半导体企业通过并购扩展业务范围并加强技术能力，市场逐渐形成两极分化趋势，行业巨头的竞争力日益增强。例如，华润通过收购长电科技、华虹等公司，逐步形成了强大的“华润系”产业链布局。此外，半导体设备企业也在进行平台化转型，通过并购拓展产品线，提升竞争力。中微公司和盛美半导体分别通过收购和技术创新，逐步从单一设备商转型为平台型企业，增强了产业整合能力。

此外，国内半导体设备的自主化进程也在加快，面对国际技术封锁和制裁，中国半导体产业逐步建立起稳定的供应链。国产设备厂商如中科飞测、北方华创等企业通过自主研发，提升了核心零部件的国产化率，降低了对外部供应链的依赖。预计到2025年，国产半导体设备的市场份额将进一步扩大。同时，国产化材料领域也取得了显著突破，企业通过收购和自主研发，打破了国外技术封锁，增强了材料的本土化生产能力。比如，华海诚科收购华威电子，成功打破国外厂商的技术封锁，推动了封装材料的国产化。

https://mp.w‍e‍ixi‍n.qq.‍com/s/3lK9u-YtZQEzc7Dyi_Inkw

元资助

风电设备：新增装机新高下的产业链机遇

2025年国内风电新增装机有望达到110-120GW，海上风电兑现高增长确定性强，海外市场呈现上行趋势。2025年我们预计国内风电新增装机110-120GW，有望连续3年创历史新高，其中我们预计国内海风有望兑现高增长，在保守和乐观情形下新增装机14/17GW。同时，海外陆风市场逐步回暖，海外海风市场或将迎来批量订单释放。

我们也提出了2025年中国风电产业链三大关注点：1）国内海风弹性方向中，我们认为海缆环节正在迎来行业订单和交付的持续上行周期，海风塔筒和风机基础环节有望随着海风开工加速而逆转过去2年的出货和盈利压力，2025年量利齐升弹性较大；2）风电整机方向，我们认为整机国内市场竞争最激烈阶段或已过去，海外风机公司已经逐步收缩至高价市场，国内风机公司有望长周期受益于国内海风和出口的持续拉动，这一趋势下我们预计行业2024年开始的盈利回升趋势有望持续；3）风电出口方向，我们建议优先关注正在迎来集中的订单采购景气周期的海外风机基础环节和国内新签订单持续增长的整机环节。

http‍s://mp.w‍‍e‍ix‍in.qq.com/s/sf_Pfu7LSSQGLNUq2HDX8g

推特

00Arxiver开源：包含 138,830 篇 arXiv 论文的多Markdown格式

奥特曼爆料：OpenAI Pro订阅上正在亏钱

疯狂的事情是：我们目前在 OpenAI Pro 订阅上正在亏钱！

用户的使用量远超我们的预期。

https://x.com/sama/status/1876104315296968813

MiniPerplx 的新版本：搜索网页、𝕏 上的帖子、研究论文、YouTube 视频——以及电影和电视剧

MiniPerplx 的新年焕新版本来了！🚀

现在可以搜索网页、𝕏 上的帖子、研究论文、YouTube 视频——以及电影和电视剧啦！

搜索页面现已回归为默认主页！

由 @vercel 和 @xai 提供支持和赞助！🫡

实时网站和代码链接在回复中 🔗

快速演示一下 grok 搜索 𝕏 帖子的效果 ↓

https://x.com/rauchg/status/1875652800283340882

OpenCoconut 在使用 Gemma2 的日语翻译中取得准确率提升，从 19% 飙升到 92%

OpenCoconut 在使用 Gemma2 的日语翻译中取得了惊人的准确率提升，从 19% 飙升到 92%🤯

我计划将其他人取得的一些成功经验直接应用到 OpenCoconut 中——敬请期待！

https://x.com/casper_hansen_/status/1875872309996855343

曾定义 AI 能力、却被 AI 超越的基准任务

AI 在 2024 年又击败了 5 个基准测试。

Killed by LLM

向那些曾定义 AI 能力、却被 AI 超越的基准任务致敬

• @lmstudio

https://x.com/Thom_Wolf/status/1875873271255810400

异步 AI 代理：让 AI 代理更快运行，支持并行执行

⚡推出异步 AI 代理 @PraisonAI

让 AI 代理更快运行，支持并行执行

🚀 并行运行 AI 代理

🛡️ 非阻塞操作

🔌 简单易用的集成

🌟 支持开源 AI 模型

⚙️ 提供无代码和代码解决方案

✨ 简单三步实现流程

🔄 异步执行

🎮 工作流程并行化

请转发 🙇

• @lmstudio

https://x.com/MervinPraison/status/1875498785947648435

OpenAI 正开始将注意力转向“超级智能”

OpenAI 正开始将注意力转向“超级智能”。

在个人博客的一篇文章中，OpenAI 的 CEO Sam Altman 表示，他相信 OpenAI “知道如何构建（人工通用智能，AGI）”，这是根据传统理解的定义——并且现在正在将目标转向“超级智能”。

“我们热爱当前的产品，但我们是为了辉煌的未来而存在的，”Altman 在周日晚间发表的文章中写道。“超级智能工具可以大幅加速科学发现和创新，远远超越我们单凭自己所能实现的能力，从而极大地增加社会的繁荣与富足。”

Altman 此前曾表示，超级智能可能在“几千天”内到来，而且它的到来会比人们想象的“更加震撼”。

• @lmstudio

https://x.com/TechCrunch/status/1876092107326165309

产品

OpenBolt Web全栈应用开发工具

使用 OpenBolt，用户可以轻松完成从构思到上线的全栈 Web 应用开发。通过其强大的 AI 驱动功能，OpenBolt 可自动生成项目结构，并根据需求进行高度定制，显著减少开发时间。平台支持快速提示、运行和编辑代码，同时提供一键部署的便捷工具，使开发者能够专注于创意实现，而无需担忧繁琐的基础设施配置。无论是初学者还是资深开发者，OpenBolt 都是打造高效、现代化 Web 应用的理想解决方案。

https://www.openbolt.dev/?ref=producthunt

That’s Rank! 谷歌SEO关键词追踪工具

轻松追踪您的网站在 Google 搜索中的排名表现。提供每日更新、历史数据以及可操作的 SEO 洞察，帮助用户全面优化网站表现。这一切都通过一个美观且操作简便的界面呈现，让数据分析变得更直观。测试版现已免费开放，助力更多用户抢占搜索引擎优化先机！

https://www.thatisrank.com

投融资

00Arxiver开源：包含 138,830 篇 arXiv 论文的多Markdown格式

「大漠大智控」完成数亿元融资

深圳大漠大智控技术有限公司（“大漠大智控”）近期完成了数亿元人民币的A轮融资，本轮由同创伟业领投，招银国际、招商局创投、深高新投及财鑫集团跟投，庚辛资本担任独家战略财务顾问。此次资金将主要用于加大人工智能产品线研发与海外市场的拓展。公司以无人机集群表演而广为人知，2024年9月，其成功打破“单台电脑控制最多无人机同时升空”和“最多无人机组成空中图案”两项吉尼斯世界纪录，吸引了全球的关注。

自2016年成立以来，大漠大智控专注于无人机集群自动化表演系统的研发，拥有超过100项核心自主知识产权。公司提供的自动化无人机集群系统包括无人机、飞控系统、智能收纳箱等一体化设备。通过无人机群体飞行和灯光、音乐的结合，企业为观众提供震撼的视觉体验。其技术在多个场景中应用，如大型活动、文旅景区、空中广告等，并已经在深圳、重庆、上海等50多座城市建立了常态化应用基地。

在硬件方面，大漠大智控采用高性能的电机、传感器等核心部件，确保无人机表演过程中的自动补点与稳定性。软件方面，其推出的新一代集群自动化表演系统V3，使得无人机轨迹的生成及优化更加智能化，显著降低了编辑时间并提高了飞行精度和稳定性。未来，随着AI大模型和智能硬件的融合，行业向着安全化、自动化、智能化和网络化发展。

此次融资的投资方均对大漠大智控的市场前景给予高度评价。张一巍认为，无人机表演作为低空经济的一部分，具有广阔的市场潜力，能够为公司提供技术积累和底层技术储备，有助于未来在更广泛的应用场景中拓展。招商局创投则看好公司在智能控制领域的创新，并表示将依托集团的产业优势推动其技术与市场拓展。深圳高新投投资团队也指出，凭借政策支持和海外拓展的红利期，公司有望在低空经济和人工智能领域取得更大突破。

大漠大智控不仅在国内市场取得了显著成绩，海外市场也已覆盖日本、韩国、新加坡等20多个国家和地区，且海外营收占比达到30%。随着公司加大研发投入，预计其在全球范围内的市场份额将进一步扩大，未来将在智能化集群技术领域继续引领行业发展。

公司官网：https://www.dmduav.com/