我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即 可在飞书每日收到《大模型日报》每日最新推送
学术分析报告:ResearchFlow — 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢 迎 大 家 一 起 交 流 !
信号
Birdie: Advancing State Space Models with Reward-Driven Objectives and Curricula
这篇文章介绍了一种名为Birdie的新训练程序,它显著提高了状态空间模型(SSMs)在上下文检索任务中的性能,例如长文本复制、联想回忆和长文本问答,而无需改变其架构。Birdie结合了双向输入处理和专门的预训练目标的动态混合,通过强化学习进行优化。文章还介绍了一种新的双向SSM架构,它能够从双向上下文处理无缝过渡到因果生成。实验评估表明,Birdie在检索密集型任务上的性能显著提高,缩小了与Transformers的性能差距,同时保持了计算效率。文章强调了训练程序在利用SSMs固定状态容量中的重要性,并为提高其能力提供了新的方向。所有代码和预训练模型都在提供的URL上可用,支持JAX和PyTorch。
https://arxiv.org/abs/2411.01030
ResearchFlow: https://rflow.ai/flow/caaf8f0e-52be-4e22-99bb-61310913fd6b (PC端食用更佳)
The Surprising Effectiveness of Test-Time Training for Abstract Reasoning
这篇文章探讨了在测试时训练(Test-Time Training, TTT)作为一种提高模型推理能力的机制的有效性。作者使用抽象和推理语料库(Abstraction and Reasoning Corpus, ARC)作为基准,通过系统实验确定了成功的TTT三个关键组成部分:(1)在类似任务上的初始微调;(2)辅助任务格式和增强;(3)每个实例的训练。TTT显著提高了ARC任务的性能,与基础微调模型相比,准确度提高了6倍;在8B参数的语言模型上应用TTT,ARC公共验证集的准确率达到53%,比公开的纯神经方法提高了近25%。通过将TTT方法与最近的程序生成方法相结合,达到了61.9%的公共验证准确率,与人类平均得分相匹配。这些发现表明,显式的符号搜索并不是提高神经语言模型抽象推理能力的唯一途径;在少量样本上继续训练的额外测试时间也非常有效。
https://ekinakyurek.github.io/papers/ttt.pdf
ResearchFlow: https:https://rflow.ai/flow/8aae3d98-be9a-4e8d-bcc5-b3dae57b61c7 (PC端食用更佳)
A SCALABLE COMMUNICATION PROTOCOL FOR NETWORKS OF LARGE LANGUAGE MODELS
这篇文章介绍了一个名为Agora的元协议,它利用现有的通信标准,使由大型语言模型(LLM)支持的智能代理能够高效地解决复杂问题。在Agora中,代理通常使用标准化的例程进行频繁通信,使用自然语言进行罕见通信,并使用LLM编写的例程处理两者之间的所有事务。Agora规避了智能代理通信的三难困境,能够稳健地处理接口和成员的变化,允许在完全去中心化和最小人类干预的情况下实现前所未有的可扩展性。在大型Agora网络上,观察到自我组织、完全自动化的协议的出现,这些协议在没有人类干预的情况下实现复杂目标。
https://arxiv.org/pdf/2410.11905
ResearchFlow: https://rflow.ai/flow/5c1c0dfb-b04c-42ca-9d69-794ca6141047 (PC端食用更佳)
ai-chatbot
这是一个基于 Next.js 和 Vercel AI SDK 构建的开源 AI 聊天机器人模板。它提供了丰富的功能,包括基于 Next.js App Router 的高级路由、React Server Components (RSCs) 和 Server Actions 的服务器端渲染、支持多种 AI 模型提供商(如 OpenAI、Anthropic、Cohere 等)、数据持久化、身份验证等。
https://github.com/vercel/ai-chatbot
MoneyPrinterTurbo
MoneyPrinterTurbo 是一款基于 AI 大模型的视频生成工具,用户只需提供主题或关键词,即可全自动生成视频文案、素材、字幕和背景音乐,最终合成高清短视频。该项目采用完整的 MVC 架构,代码结构清晰且易于维护,支持 API 和 Web 界面。
https://github.com/harry0703/MoneyPrinterTurbo
Letta
Letta 是一个开源框架,用于构建具有高级推理能力和透明长期记忆的有状态 LLM 应用程序。该框架是白盒且模型无关的。
https://github.com/letta-ai/letta
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/11/21690.html