欢迎观看大模型日报,进入大模型日报群和空间站(活动录屏复盘聚集地)请直接扫码。社群内除日报外还会第一时间分享大模型活动。
学习
DSPy 入门: 再见提示,你好编程

Infini-mini-transformer: 对谷歌最新提出的Infini-transformer模型进行代码复现(含小规模的预训练过程)

一文看懂Score-based模型的基本原理(一)

不受窗口长度限制的长文本生成全新思路:利用模型参数储存上文信息

基于unsloth框架完成7B规模模型SFT微调训练(10GB显存占用)
深度生成模型课程
接受LLM非确定性

Dllama

CSGHub
https://github.com/OpenCSGs/CSGHub
Risu


大模型日报16
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/04/15998.html