特别活动!
欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。
论文
鹰与金翅雀:使用矩阵值状态和动态递归的RWKV

MiniCPM:揭示小型语言模型通过可伸缩训练策略的潜力

吴氏方法可以提升符号人工智能,使其与IMO几何银牌选手匹敌,AlphaGeometry超越金牌选手

AgentQuest: 一个模块化的基准框架,用于衡量进展并改进LLM智能体

Transformer的可解释性能否转移到RNNs?

高噪音调度是必要的

MuPT:一个音乐生成符号预训练Transformer

书生·浦语灵笔2:视觉语言模型,可以处理从336像素到4K高清的分辨率
https://x.com/arankomatsuzaki/status/1777872267709464618
Open-Sora-Plan

ByteEdit

大模型日报16
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/04/16256.html