我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
论文
xLSTM: 扩展长短期记忆网络

Granite 代码模型:用于代码智能的开放基础模型家族

NaturalCodeBench:研究HumanEval和自然用户提示中的编码能力不匹配

QServe: W4A8KV4量化和系统共同设计,提高高效LLM服务

vAttention: 为大语言模型提供动态内存管理,无需分页注意力

StoryDiffusion

JARVIS

ScrapeGraphAI
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/05/15557.html