大模型日报(2月15-16日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

欢迎大家一起交流!

大模型日报(2月15-16日 资讯篇)

资讯

01

信接入满血版DeepSeek R1,开启AI搜索灰度测试
2025年2月16日,微信正式接入DeepSeek R1大模型并开启灰度测试。此次接入的是满血版DeepSeek R1,用户可通过微信首页顶部搜索框进入「AI搜索」功能,选择快速回答或深度思考模式。该功能的信息源结合了公众号推文与网页搜索,用户可连续追问以获取更精准结果。不过,目前AI搜索尚未配备历史记录功能,且在测试中仍存在一些问题,如搜索结果不够准确等。
此次合作是微信与DeepSeek强强联手的重要一步,意味着DeepSeek的能力将更广泛地惠及用户。此前,腾讯旗下应用「元宝」已接入DeepSeek R1,并支持联网搜索。此外,腾讯智能工作台ima.copilot也接入了该模型,显著提升了「读」和「写」功能。目前,微信端搜索「ima知识库」小程序也可体验到DeepSeek R1的深度思考能力。
大模型日报(2月15-16日 资讯篇)
https://mp.weixin.qq.com/s/xB3sBZJeHd0CbbBQPIJi9g

02

Anthropic团队探讨AI智能体构建:理性看待消费者代理场景

Anthropic的研究员Barry Zhang、Erik Schultz和Alex Albert在近期的谈话中深入探讨了AI智能体的构建与应用。他们强调AI智能体与工作流的区别:工作流是固定步骤的LLM调用序列,而智能体则更具自主性,可自主决定运行次数直至找到解决方案。在代理提示方面,其特点是开放性更强,允许模型使用多种工具如搜索和代码编辑等。

团队指出,开发者在构建智能体时需从模型角度出发,明确提示、工具描述和环境信息。他们还提到,当前消费者AI代理被过度炒作,其实际应用难度被低估,因为明确用户偏好和任务要求与自己完成任务难度相当。相反,智能体在编码和搜索等容错成本低、验证容易的复杂任务中更具价值。

对于2025年智能体的未来展望,Barry认为多智能体环境将是一个有趣的研究方向,智能体之间的互动和协作模式值得探索。Erik则认为,智能体将在业务应用中大量普及,自动化重复性任务并扩大业务规模,但面向消费者的智能体采用可能暂时不会大规模发生。

团队给开发者的建议是确保能够衡量结果并获得有效反馈,从简单开始逐步增加复杂性,并构建能够随着模型改进而受益的产品。

大模型日报(2月15-16日 资讯篇)
https://mp.weixin.qq.com/s/iQkeW1SgVYpgXRcTC7yz6g

03
元资助

国产算力产业链投资展望

中信建投证券发布《通信行业2025年投资策略报告:通信视角下的新质生产力:科技自强,先进发展》,分析了2025年算力产业链的投资机会,强调海外景气度投资与国内自主可控两大方向。海外方面,英伟达NVL36、72机柜出货及新技术如CPO、MPO的成熟将带来增量变化;国内则因美国限制,国产AI芯片发展紧迫性凸显,需关注出货量、生态和产品力。报告还指出,液冷技术因机柜功耗增加迎来黄金时代,铜连接需求因机柜方案主流化高速增长,电源行业因功率密度升级实现量价齐升。此外,报告强调国产AI芯片的重要性,认为其发展需聚焦出货量、自主生态构建和产品力。风险方面,需关注宏观经济、国际环境、供应链稳定性等因素对产业链的影响。

大模型日报(2月15-16日 资讯篇)
https://mp.weixin.qq.com/s/Q1sVK8Y2SrteNpF8fBHNEQ

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格

DeepSeek分享:推荐的最佳使用设置

🎉 很高兴看到大家对部署 DeepSeek-R1 的热情!以下是我们推荐的最佳使用设置:

• 不使用系统提示词

• Temperature:0.6

• 官方搜索 & 文件上传提示词: http://bit.ly/4hyH8np

• 规避模型绕过思维的指南: http://bit.ly/4gJrhkF

官方的 DeepSeek 部署运行的模型与开源版本相同——尽享完整的 DeepSeek-R1 体验!🚀

大模型日报(2月15-16日 资讯篇)

https://x.com/deepseek_ai/status/1890324295181824107


02 

微软发布OmniParser V2:让任何 LLM 都能成为计算机使用代理

微软刚刚发布了 OmniParser V2,看起来非常强大!

让任何 LLM 都能成为计算机使用代理。

大模型日报(2月15-16日 资讯篇)


https://x.com/_akhaliq/status/1890546832784208080



03


Jina-Deepsearch-v1: 首个具备推理和规划能力的智能搜索系统

推出 jina-deepsearch-v1,它能:

搜索、阅读、推理,

搜索、阅读、推理,

搜索、阅读、推理,

搜索、阅读、推理,

搜索、阅读、推理,

搜索、阅读、推理,

… 🔄 直到找到最佳答案。

DeepSearch 是我们首个具备推理和规划能力的智能搜索系统,非常适用于复杂查询。

立即体验 👉 https://jina.ai/deepsearch

你还可以在本地聊天客户端(如 Chatwise、Cherry Studio、Chatbox)中使用。

我们的 API 完全兼容 OpenAI Chat API 规范,只需更换域名即可无缝集成!

大模型日报(2月15-16日 资讯篇)

https://x.com/JinaAI_/status/1890410008590086278




04

Perplexity 深度研究代理:免费开放,付费用户可获得 专家级研究支持

很高兴介绍 Perplexity 深度研究代理:对所有用户 免费 开放!

付费用户 只需 $20/月,即可获得 专家级研究支持,涵盖任何主题,每天最多 500 次查询,并且不到三分钟即可获得完整的研究报告。

大模型日报(2月15-16日 资讯篇)

https://x.com/AravSrinivas/status/1890464738951233536




05


不要把整个代码库喂给 AI?CodeMap:提取代码的核心模式和关系,更少的代码,更关键的信号

不要把整个代码库喂给 AI。LLMs 并不会真正“阅读”代码——它们只是匹配模式。

CodeMap 提取代码的核心模式和关系,让你展示更少的代码,却传递更关键信号。

减少无用信息,避免让上下文窗口充满噪音。

大模型日报(2月15-16日 资讯篇)

https://x.com/RayFernando1337/status/1890774044758147223




06


Isenberg分享Startup Ideas Pod :Logan展示Gemini 的全新“实时流式处理”功能等

上周,我看到了未来我们如何与 AI 一起工作的方式。

Logan(Google AI Studio 负责人)向我展示了 Gemini 的全新“实时流式处理”功能。他打开了自己的代码编辑器,随口对着 AI 说:“嘿,我应该改这个函数吗?”

接下来的场景太震撼了,你一定要亲眼看看。

AI 正在“观看” 他的屏幕——真正地在看,能看到他的光标移动,理解他的代码,并实时提供反馈。这就像是在和一个永远不会累的 AI 进行结对编程。

我之前玩过 Claude、ChatGPT,甚至用 v0/Bolt 搭建项目,它们都很强大,但这次体验完全不同。就像真的有一个 AI 副驾驶在“看”你的屏幕,理解上下文,并实时提供帮助。

这让我重新思考 AI 的可能性:

• 编程 – 直接询问你正在查看的代码

• 调试 – 看到错误,实时反馈

• 学习新工具 – 观察你的操作,提供指导

• 写作 – 看到你的输入,给出优化建议

这个技术的核心真的很酷:

• 实时处理整个屏幕内容

• 理解空间上下文

• 能处理 50 万+ 令牌(相当于几秒内读完一本书)

• 记住整个会话,提供持续性支持

更令人惊讶的是,Google 正在 AI Studio 里免费提供这个功能。是的,他们正在和 OpenAI 竞争,但对开发者来说,这实在是太有价值了。

感谢 @OfficialLoganK 的时间和演示,这真的让我大开眼界。

以下是完整的 Startup Ideas Pod 访谈,其中还有另外 两个 AI 演示,值得一看:

📺 https://youtube.com/watch?v=6h9y1rLem4c

大模型日报(2月15-16日 资讯篇)

https://x.com/gregisenberg/status/1890787876348318108



产品

01

Bolt + Expo:无需编写任何代码,将你的想法转化为移动应用程序


Bolt + Expo,你只需通过指令就能创建可投入生产的移动应用程序。Bolt 与 Expo 的集成,通过结合 React Native 的强大功能和 Bolt 的前沿人工智能代理,消除了移动开发的传统障碍。

功能

  1. 无代码应用创建:用户仅通过指令就能将应用想法转化为可投入生产的原生移动应用,无需编写代码,降低了移动应用开发门槛。

  2. 集成前沿技术:整合 React Native 的强大功能和 Bolt 的前沿人工智能代理,消除传统移动开发障碍,提供高效开发环境。

  3. 简易操作流程:在 bolt.new 平台上,简单输入类似 “帮我创建一个…… 的移动应用程序” 指令,并附上应用想法,即可启动应用创建流程,操作便捷。

    大模型日报(2月15-16日 资讯篇)

https://bolt.new/

 投融资

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

上海交大博士创业,再获亿元融资

近日,超睿科技(上海)有限公司完成亿元级别的A1轮融资。本轮融资由洪泰基金领投,龙鼎投资、三合资本等机构跟投,深蓝资本担任独家财务顾问。融资将主要用于高性能CPU产品的研发与商业化。超睿科技成立于2021年,核心团队组建于2019年,专注于研发基于RISC-V架构的高性能、高能效、智能化多核处理器芯片,致力于打造国产处理器产业应用生态。公司总部位于上海张江,并在上海、长沙和无锡设立研发基地。

超睿科技的CEO施军是上海交通大学计算机系博士,曾任上海交通大学软件学院副院长;CTO蒋江是国防科技大学计算机学院博士,曾参与多代国产高性能CPU研发。公司凭借顶尖团队和技术优势,选择RISC-V架构作为技术路线,成功绕过专利壁垒,实现技术突破。其第一代RISC-V处理器核性能指标处于行业领先水平,即将在2025年Q1发布多核高性能桌面级CPU产品。

自成立以来,超睿科技已完成4轮融资。2022年1月,公司完成天使轮融资;同年10月完成A轮融资;2023年完成约亿元A轮融资。此次A1轮融资进一步彰显了资本市场对其技术突破的认可。洪泰基金董事总经理王远博表示,超睿科技拥有国内少有的高性能CPU研发能力,产品性能可对标国际高端产品。龙鼎投资合伙人刘立哲认为,RISC-V架构正从替代选项升级为创新基座,超睿科技在高性能CPU领域具备扎实技术能力。三合资本创始合伙人郝旭东指出,超睿科技凭借深度优化能力率先实现高性能多核芯片量产落地。

超睿科技的成长轨迹揭示了破局之道:以RISC-V开放架构绕过专利壁垒,凭借顶尖团队实现技术跨越,并借助资本助力加速产品迭代。其背后是上海交大创新生态的持续赋能。2024年,上海“交大系”企业完成94起融资,累计金额达102亿元,占上海融资总额的11%。超睿科技的实践表明,中国企业有望在RISC-V领域实现弯道超车,推动中国信息产业自主可控发展。

https://mp.weixin.qq.com/s/jyVHTdc4rPj-ZJNcLEeTNA


推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话


快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画


原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/02/38264.html

Like (0)
Previous 2025-02-15 12:42
Next 2025-02-16 23:59

相关推荐