我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!

信号
ProTracker: Probabilistic Integration for Robust and Accurate Point Tracking
本文提出了 ProTracker,这是一种用于对视频中的任意点进行稳健且准确的长期密集跟踪的新颖框架。方法的关键思想是结合概率集成来细化来自光流和语义特征的多个预测,以实现稳健的短期和长期跟踪。具体而言,以概率方式集成光流估计,通过最大化每个预测的可能性来产生平滑而准确的轨迹。为了有效地重新定位由于遮挡而消失和重新出现的具有挑战性的点,进一步将长期特征对应关系纳入流量预测中以进行连续轨迹生成。大量实验表明,ProTracker 在无监督和自监督方法中实现了最佳性能,甚至在多个基准测试中优于监督方法。
https://michaelszj.github.io/protracker/
ResearchFlow链接:https://rflow.ai/flow/44eb135b-0839-42e7-b13e-913c5968616d
rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking
本文提出 rStar-Math 来证明小型语言模型 (SLM) 可以与 OpenAI o1 的数学推理能力相媲美甚至超越它,而无需从优秀模型中进行提炼。rStar-Math 通过蒙特卡洛树搜索 (MCTS) 进行“深度思考”来实现这一点,其中数学策略 SLM 在基于 SLM 的过程奖励模型的指导下执行测试时搜索。rStar-Math 引入了三项创新来应对训练两个 SLM 的挑战:(1) 一种新颖的代码增强 CoT 数据合成方法,该方法执行广泛的 MCTS 部署以生成用于训练策略 SLM 的经过验证的逐步推理轨迹;(2) 一种新颖的过程奖励模型训练方法,避免了简单的步骤级分数注释,从而产生了更有效的过程偏好模型 (PPM);(3) 一种自我进化配方,其中从头开始构建策略 SLM 和 PPM 并迭代进化以提高推理能力。通过 4 轮自我进化,rStar-Math 为 747,000 道数学题合成了数百万个解决方案,将 SLM 的数学推理能力提升到了最先进的水平。在 MATH 基准测试中,它将 Qwen2.5-Math-7B 从 58.8% 提高到 90.0%,将 Phi3-mini-3.8B 从 41.4% 提高到 86.4%,分别比 o1-preview 高出 +4.5% 和 +0.9%。在美国数学奥林匹克竞赛 (AIME) 上,rStar-Math 平均解答率为 53.3% (8/15),跻身最聪明的高中数学学生的前 20%。
https://arxiv.org/abs/2501.04519
ResearchFlow链接:https://rflow.ai/flow/b57ed105-1a6c-423c-8064-2a800275d848
HuggingFace&Githup
Preswald 全栈工具平台
Preswald 是一个用于构建、部署和管理交互式数据应用程序的全栈平台。它将提取、存储、转换和可视化功能整合到一个轻量级且功能强大的 SDK 中。无论您是要设计内部工具的原型还是部署生产级应用程序,Preswald 都能在不影响灵活性的情况下降低复杂性和成本。
-
代码优先的简单性。使用最少的 Python 和 SQL 即可实现强大的应用程序
-
端到端覆盖。在一个平台上处理摄取、ETL 和可视化
-
高效的设计。避免现代数据堆栈的庞大复杂性,同时保持其有效性。
-
几秒钟内连接到 CSV、JSON、Parquet 或 SQL 数据库。
-
完全可定制的主题。您的应用,您的品牌 — 只需在 中调整图像和名称即可
config.toml
。
-
https://github.com/StructuredLabs/preswald
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2025/01/32667.html