我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
论文
AlphaMath几乎无需过程监督

MAmmoTH2:利用网络数据扩展指令集

推进 Gemini 多模态医疗能力

具备 3D 理解能力的语言-图像模型

ImageInWords:解锁超详细图像描述

使用离散傅里叶变换的参数高效微调

以少搏多:在LLMs的微调热身中的基于原则的数据选择

高稀疏性基础 Llama 模型的高效预训练与部署

Vibe-Eval:用于衡量多模态语言模型进展的苛刻评估集

REASONS:测试开源和闭源LLM检索和自动引用科学句子的基准

通过符合性弃权来减轻LLM的幻觉

理解LLM需要不仅仅是统计泛化

大语言模型中GLU变体的依赖感知半结构化稀疏性

JAT:不偏科的RL智能体“六边形战士”

Long Context ICL 的表现超过 fine-tuning


语言模型过拟合评测
efficient-kan
Unitxt

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/05/15588.html