大模型日报(9月12日 学术篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(9月12日 学术篇)

论文

01

智能体工作流记忆

尽管基于语言模型的智能体在解决诸如网页导航等现实世界任务方面具有潜力,但当前的方法仍然在具有复杂动作轨迹的长期任务中遇到困难。相比之下,人类可以通过从过去经验中学习可重用的任务工作流程并将其用于指导未来动作,灵活地解决复杂任务。为了构建能够从这一过程中获益的智能体,我们引入了智能体工作流记忆(AWM),一种用于诱导常用重复例程(即工作流程)并有选择地为智能体提供工作流程以指导后续生成的方法。AWM灵活地适用于离线和在线场景,智能体可以事先从训练示例中诱导工作流程,也可以即时从测试查询中诱导。我们在两个主要的网页导航基准上进行了实验–Mind2Web和WebArena–涵盖了来自旅行、购物、社交媒体等200多个领域的1000多个任务。AWM显著提高了基准结果,在Mind2Web和WebArena上相对成功率分别提高了24.6%和51.1%,同时减少了成功解决WebArena任务所需的步骤。此外,在跨任务、网站和领域评估中,在线AWM可以稳健地泛化,超越基准,当训练-测试任务分布差距扩大时,优势从8.9到14.0绝对点。
大模型日报(9月12日 学术篇)
大模型日报(9月12日 学术篇)http://arxiv.org/abs/2409.07429v1
02

Think Together and Work Better: 结合人类和LLM的心理声音结果,实现有效的文本评估

本研究介绍了 textbf{InteractEval},一个整合人类专业知识与大语言模型 (LLMs) 的框架,利用“思考大声”(TA)方法为基于检查表的文本评估生成属性。通过将人类的灵活性和推理与LLM的一致性结合起来,InteractEval在四个不同维度,包括连贯性、流畅性、一致性和相关性方面,优于传统非LLM和LLM基线。实验还调查了TA方法的有效性,显示其促进了人类和LLM的发散思维,导致生成更广泛相关属性,提高了文本评估性能。比较分析表明,人类擅长识别与内部质量相关的属性(连贯性和流畅性),但LLMs在与外部对齐相关的属性(一致性和相关性)方面表现更好。因此,充分利用人类和LLMs一起能产生最佳评估结果。换句话说,本研究强调了在自动化基于检查表的文本评估框架中有效结合人类和LLMs的必要性。代码位于 textbf{url{https://github.com/BBeeChu/InteractEval.git}}。
大模型日报(9月12日 学术篇)
大模型日报(9月12日 学术篇)http://arxiv.org/abs/2409.07355v1
03

门控插槽注意力:高效线性时间序列建模

本文介绍了门控槽关注(GSA),它通过结合受门控线性注意力(GLA)启发的门控机制来增强具有有界内存控制(ABC)的注意力。 GSA由两层GLA组成,通过softmax连接,利用上下文感知的内存读取和自适应遗忘来提高内存容量,同时保持紧凑的循环状态大小。这种设计通过GLA的硬件高效训练算法和减小的状态大小极大地增强了训练和推理效率。在“微调预训练Transformer为RNN”(T2R)设置中保留softmax操作尤为有益,减少了从头开始进行广泛训练的需要。广泛的实验验证了GSA在需要上下文召回和T2R设置中的优越性能。
大模型日报(9月12日 学术篇)
大模型日报(9月12日 学术篇)http://arxiv.org/abs/2409.07146v1
04

合成持续预训练

摘要:在大规模、非结构化的互联网文本上进行预训练,使语言模型能够获得大量世界知识。然而,这种知识获取是数据效率低下的——为了学习一个给定的事实,模型必须在数百到数千种不同的表示形式上进行训练。当将预训练模型适应到小语料库的特定领域文档时,这就构成了挑战。为了弥合这一差距,我们提出了一种合成持续预训练的方法:利用小的特定领域语料库来合成一个更适合学习的大语料库,然后在合成语料库上继续进行预训练。我们用EntiGraph实现了这一提议,这是一种合成数据增强算法,从源文档中提取显著实体,然后通过连接抽样的实体生成多样化的文本。使用EntiGraph进行合成持续预训练,可以使语言模型能够回答与源文档相关的问题并遵循通用指令,而无需访问这些文档。如果在推理时可访问源文档,我们展示通过我们的方法获得的知识与检索增强生成相结合。为了更好理解这些结果,我们建立了一个简单的EntiGraph数学模型,并展示了合成数据增强如何“重新排列”知识以实现更高效的学习。
大模型日报(9月12日 学术篇)
大模型日报(9月12日 学术篇)http://arxiv.org/abs/2409.07431v1
05

表征微调

激活工程在在线控制大语言模型(LLM)中越来越受欢迎。本文扩展了用代表兴趣行为方向的向量进行主动导向的思想,直接将这些向量微调到模型中,避免了在线控制的需要。作者首先识别了与诚实相关的激活向量,然后通过在生成过程中向残差流激活加上这些向量的倍数来使模型输出变得更或更不诚实。接着,作者展示了通过将这些向量直接微调到模型中,同时使用基于余弦相似性和标准token损失的双损失函数(“表示微调”),可以实现类似的效果。最后,作者比较了生成的响应模型对来自不同模型的诚实探测提示的反应,结果显示通过余弦相似性加token损失微调向量到模型中,效果比在线导向更强,并且比使用标准损失泛化得更好,显示了这种方法作为一种安全措施的潜在实用性。
大模型日报(9月12日 学术篇)
大模型日报(9月12日 学术篇)http://arxiv.org/abs/2409.06927v1
HuggingFace&Github

01

Draw an Audio

Draw an Audio 是一种创新的视频到音频合成方法,通过结合文本、视频和信号指令,利用潜在扩散模型生成高质量的同步音频,克服了传统方法的可控性和灵活性不足的问题,展现出更强的实用性和创意潜力。

大模型日报(9月12日 学术篇)https://yannqi.github.io/Draw-an-Audio/

02

Llama-3.1-8B-Omni

LLaMA-3.1-8B-Omni 是一个高质量的语音语言模型,支持低延迟(226 毫秒)且能够同时生成文本和语音响应,实现无缝的语音交互。它基于 Llama-3.1-8B-Instruct 构建,训练速度快,适用于语音助手等应用场景。
大模型日报(9月12日 学术篇)https://huggingface.co/ICTNLP/Llama-3.1-8B-Omni
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

  3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/09/12981.html

Like (0)
Previous 2024-09-12 16:35
Next 2024-09-13 06:41

相关推荐

  • 大模型日报(9月9日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-09-09
    275
  • 大模型日报(8月6日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-06
    230
  • 导师交流心得 关于Introduction

    坐在咖啡馆,做个小笔记 第一篇打算投稿的文章写得七七八八,发给导师之后,以为能够得到详实具体的反馈建议,结果老板说有点“为难他”,于是我晚上主动拉了个会议,想一探究竟我干了什么“为…

    2022-07-20
    219
  • 大模型日报(5月18~19日 学术篇)

    特别活动 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流!…

    2024-05-19
    180
  • 大模型日报(5月31日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 学习 0…

    2024-05-31
    104
  • 大模型日报(6月29~30日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-06-30
    239
  • 大模型日报(7月1日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-01
    210
  • AI学术 | Covidence 完成一篇系统文献综述(SLR),平均时间减少71个小时!

    完成一篇系统文献综述(SLR)是一个体系化的工作,总是绕不开搜索、过滤、阅读、标记、交叉评审等各种环节,而Covidence能够让完成一篇SLR减少35%的工作量,并且减少71个小…

    2023-07-05
    142
  • 大模型日报(6月28日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-06-28
    158
  • 大模型日报(9月30日 学术篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-10-03
    253