我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
论文
大语言模型的时间尺度定律

CRISPR-GPT:一种用于自动设计基因编辑实验的LLM智能体

高效的大语言模型推断与Kcache

ComposerX: 基于LLMs的多智能体符号音乐创作
MileBench: 在长上下文中对多模态语言模型进行基准测试
TextGram:面向更好的领域自适应预训练
更多强化学习,更多信任?关于人类偏好调整对大语言模型可靠性的影响
DPO遇到PPO:针对RLHF的强化token优化
银河通用和智源入选中关村论坛重大科技成果发布
LlamaIndex通过结合知识图谱增强Agent记忆能力

Llama-3-8B被扩展到1048k上下文(非官方)

Make Your LLM Fully Utilize the Context

TELA
http://jtdong.com/tela_layer/
MaPa
https://zhanghe3z.github.io/MaPa/
大模型日报16
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/04/15672.html