去年爆火的大模型综述,如今出书了(附下载) 特工宇宙 • 2024-04-19 23:53 • 产品 • 552 views ❗点击文末“阅读原文”即可免费下载。 相信很多朋友都看过这篇论文,在 2023 年 3 月,一支来自中国人民大学的团队,发表了一篇大模型综述《A Survey of Large Language Models》. 如果还是觉得陌生,那么你一定在各类研报、文章等渠道中看过这张图👇,而它就出自这篇综述。 该项目发展历程: 1. 综述爆火,如今更新到第 13 个版本,包含了 83 页的正文内容,并收录了 900 余篇参考文献。 论文地址:https://arxiv.org/abs/2303.18223 2. 2023 年 8 月发布了该综述(v10)的中文翻译版。 3. 在 2023 年 12 月底,为更好地提供大模型技术的中文参考资料,团队启动了中文书的编写工作,并且于 2024 年 4 月 15 日左右完成初稿。 项目地址:https://llmbook-zh.github.io/ 点击上方链接即可免费本书下载 PDF 版本,亦可点击“阅读原文”获取。 该书共 391 页,参考文献共 447 篇,旨在为对大模型技术感兴趣的初学者提供全面介绍,展示整体框架和发展方向。 温馨提示:该书适合有一定深度学习知识的高年级本科生和低年级研究生阅读,可以作为入门大模型技术的首选书籍(已经推荐给身边的学弟学妹了)。 该书一共五大部分,包括大模型基础、大模型预训练、大模型微调、提示词、智能体、大模型在研究/专业领域的应用等。 里面有非常多精彩的解读与数据整理,比如 LLaMA 系列模型衍生工作进化图。 比如混合专家模型的介绍。 也有当下热门的智能体(Agent)相关介绍。 再比如各专业领域内代表性的大语言模型与数据资源。 为了更好地整理和传播大模型的最新进展与技术体系,官方也为读者提供了以下相关资源👇 LLMBox LLMBox 是一个全面的代码工具库,专门用于开发和实现大语言模型,其基于统一化的训练流程和全面的模型评估框架。LLMBox 旨在成为训练和利用大语言模型的一站式解决方案,其内部集成了大量实用的功能,实现了训练和利用阶段高度的灵活性和效率。 YuLan 大模型 YuLan 系列模型是中国人民大学高瓴人工智能学院师生共同开发的支持聊天的大语言模型(名字”玉兰”取自中国人民大学校花)。最新版本从头完成了整个预训练过程,并采用课程学习技术基于中英文双语数据进行有监督微调,包括高质量指令和人类偏好数据。 希望通过阅读本书,大家能够深入了解大模型技术的现状和未来趋势,为自己的研究和实践提供指导和启发。 一些盘点: 1. 盘点丨那些 AI 公司悄咪咪上线的产品(四) 2. 独家丨那些AI公司悄咪咪上线的产品(三) 3. 独家丨那些AI公司悄咪咪上线的产品(二) 4. 独家丨那些AI公司悄咪咪上线的产品(一) 5. 独家丨马毅加入大模型创业,已获真格投资 好玩的 AI 产品: 1. AI 搜索个人玩家,3 天独立开发上线! 2. 万知,PPT排版配图轻松搞定,还能看懂图表! 3. 字节的扣子炸裂更新,模型支持月之暗面,插件 IDE 已经上线。 4. 加持了AI的360浏览器,强大到让人感到陌生。 5. Gatekeep,仅用一句话,生成优雅的教学视频。 6. AI+播客丨Podwise,我不允许还有任何听友不知道它!!! 7. Dola,一个相当炸裂的Agent日程助理,创始团队来自全球顶尖名校! Agent 科普: 1. Agent > GPT5?吴恩达最新演讲:四种 Agent 设计范式(通俗易懂版) 2. 六分钟,Langchain 作者到底在红衫 AI 峰会上说了什么? 3. 论文解读丨AI 争夺继承权?AgentGroupChat,为 AI 群聊打造的通用框架。 4. 周鸿祎:2024 年 AI 产业发展的 16 个趋势。 原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2024/04/2541.html Like (0) 0 Generate poster 关于作者 特工宇宙 大模型日报(4月19日 学术篇) Previous 2024-04-19 18:48 大模型日报(4月20~21日 资讯篇) Next 2024-04-21 18:47 相关推荐 产品 让Agent从Chat走向Act — 我在亚马逊云AI初创活动上的分享(附ppt) 本期内容同步以语音方式更新在小宇宙播客(搜索”产品二姐“ 或”AGI产品经理手册“ ),大家根据自己需要选择不同的方式和我一起探讨,当然二姐小宇宙之前也录制了2期节目,希望大家喜欢… 2024-08-11 5650 产品 从Monica.im“智能工具箱”,Websim.ai,及李继刚“汉语新解”:AI Coding带来的新范式,不止Cursor! Monica.im是黄叔年初就安利过的插件,参看《AI创业新典范:Monica.im如何用浏览器插件撬动商业价值?| 万字长文》,那会我们就把它称为一款All in One的浏览器… 2024-09-12 5150 产品 双10亿:AI重塑搜索 | 一文看懂AI搜索现状和未来 两个10亿意味着AI要重塑搜索: 1.Perplexity截止4月,上线15个月访问超过10亿; 2.Google宣布年底要让AI Overviews覆盖10亿用户! Google… 2024-06-05 3140 产品 真格基金方爱之荣登福布斯 Midas List 全球最佳创投人榜单|Z News 2024 年 6 月 4 日,福布斯全球最佳创投人榜单(The Midas List)正式揭晓。真格基金创始合伙人兼 CEO 方爱之位列第 63 名。 这是自 2019 年起,方爱… 2024-06-05 2050 产品 MolarData| 热“AI”身边新鲜事 新鲜趣闻周五见 MOLAR FRESH 2020年第6期 MolarData人工智能新鲜趣闻,每周五更新。 腾讯35亿美元抄底收购搜狗,产品张小龙和技术王小川双剑合璧 在美股上市还不到3年的搜… 2020-10-09 1710 产品 大模型日报(9月26日 资讯篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2024-09-26 2100 产品 大模型日报(10月23日 资讯篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2024-10-23 1060 产品 2025 最新 AI Voice Agent 研究与图谱 特别感谢特工宇宙战略顾问 @庄明浩 老师的推荐。该研究由 a16z 最近发布,原文稍有晦涩,再保证对齐原意的基础上,经 DeepSeek 生活化处理翻… 2025-02-04 2730 产品 MolarData| 热“AI”身边新鲜事 新鲜趣闻周五见 MOLAR FRESH 2020年第2期 MolarData人工智能新鲜趣闻,每周五更新。 我国科学家成功研制全球神经元规模最大的类脑计算机 9月1日,浙江大学与之江实验室举办… 2020-09-04 2230 产品 Agent > GPT5?吴恩达最新演讲:四种 Agent 设计范式(通俗易懂版) 吴恩达教授最近在红杉 AI 峰会上讲述了他对 Agent 的一些看法,尽管一些媒体已经进行了相关报道,但为了分发的及时性,而采用了机翻的方式,牺牲了表述的准确性,增加了不必要的阅读… 2024-04-01 2.1K116