大模型日报(6月17日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(6月17日 资讯篇)

资讯

01

吴恩达最新 Snowflake DevDay 演讲:除了下一代基础模型,Agent 工作流如何推动更多 AI 进步?

近日,斯坦福大学教授、Landing AI 创始人&CEO 吴恩达(Andrew NG)在 Snowflake Dev Day 上与 Snowflake CEO Sridhar Ramaswamy 展开了一场对谈与演讲。
大模型日报(6月17日 资讯篇)https://mp.weixin.qq.com/s/-z9OC1wX1fFFNiBT2bpTTA
02

抖音联合博纳出品 AIGC 科幻短剧集《三星堆:未来启示录》,即梦 AI 提供首席技术支持

6 月 17 日,上海国际电影节期间,由博纳影业 AIGMS 制作中心出品制作,抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录》亮相 ” 博纳 25 周年‘向新而生’发布会 “。作为首席技术支持,即梦 AI 为该剧提供生成式人工智能技术支持。该剧第一季共 12 集,由抖音联合出品,将在抖音短剧暑期档播出。此次合作是传统影视公司与 AIGC 视频产品首次联合开发 AIGC 科幻短剧集。
大模型日报(6月17日 资讯篇)https://www.myzaker.com/article/666fe41b8e9f09520305351f
03

3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D

2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。
大模型日报(6月17日 资讯篇)https://mp.weixin.qq.com/s/y2uVCgy0ywSlsF860Byt3g
04
4

大模型+蒙特卡洛树搜索,一招让LLaMa-3 8B奥数水平直逼GPT-4

这几天,17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选赛中取得全球第 12 名的新闻刷了屏。而同时,AI 挑战赛的成绩显示,在所有 563 支 AI 参赛队伍中,最高分 34 分,平均分 18 分,赶上了人类选手平均水平。AI 参与数学竞赛的主要短板是逻辑推理能力弱,证明题很难拿到完整得分点。这也是 GPT-4、LLaMA等当前大语言模型(LLM)在需要策略和逻辑推理的任务中面临的重大挑战。其中的一大障碍是输出的准确性和可信度,尤其是在需要保证精度的数学上下文中,LLM 在推理时往往容易产生幻觉。输出结果表面上看似合理,但实际上不相关或事实不正确,最终导致不合理的推理过程。虽然像 Self-Refine 这样的重写技术有助于缓解这种倾向,但依然可能导致现实世界复杂的数学问题产生误导性或错误的结果。因此,为了应对这些挑战,来自复旦大学、上海 AI Lab 的研究者提出了 MCT Self-Refine(MCTSr),将 LLM 与蒙特卡洛树搜索(MCTS)算法相结合,并重点提高 LLM 在复杂数学推理任务(比如奥数竞赛题)中的表现。作为一种决策工具,MCTS广泛应用于人工智能中需要战略规划的场景,通常用于游戏和复杂的问题解决环境。本文通过将 MCTS 的系统探索能力与 LLM 的 Self-Refine 和 Self-Evaluation 能力相结合, 旨在创建一个更强大的框架来应对当前 LLM 难以解决的复杂推理任务。
大模型日报(6月17日 资讯篇)https://mp.weixin.qq.com/s/g2w7Rn7Q0mtz9xTPX-Q0Mw
05

字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果

当前主流的视觉语言模型(VLM)主要基于大语言模型(LLM)进一步微调。因此需要通过各种方式将图像映射到 LLM 的嵌入空间,然后使用自回归方式根据图像 token 预测答案。在这个过程中,模态的对齐是通过文本 token 隐式实现的,如何做好这一步的对齐非常关键。针对这一问题,武汉大学、字节跳动豆包大模型团队和中国科学院大学的研究人员提出了一种基于对比学习的文本 token 筛选方法(CAL),从文本中筛选出与图像高度相关的 token,并加大其损失函数权重,从而实现更精准的多模态对齐。
大模型日报(6月17日 资讯篇)https://mp.weixin.qq.com/s/CkfSefskLPJwT8-JnBSWcg
06

答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思

大语言模型(LLM)的迅速发展,引发了关于如何评估其公平性和可靠性的热议。尽管现有的评估框架如 OpenCompass、LM Eval Harness 和 UltraEval 以及各种 Benchmark 推动了行业进步,但专注于这些评估框架核心组件可信度或可靠性度量的团队却为数不多。近日,上海算法创新研究院和中国人民大学的研究团队发布了一篇名为《xFinder: Robust and Pinpoint Answer Extraction for Large Language Models》的论文。这篇论文深入分析了LLM评估框架的整体流程,重点评估了答案抽取器组件在大模型评估中的可靠性和一致性。
大模型日报(6月17日 资讯篇)https://mp.weixin.qq.com/s/C5G-rpen9OM4MmBhrByTIQ

产品

01

胃之书 AI

胃之书 Bellybook,是一款由多模态大语言模型驱动的食物洞察和记录应用。
它不是全知全能的对话类 AI,它只专注于服务你的饮食生活。
创作者表示,人类的情感、情绪与回忆,才是真正的”智能”,而 AI 只是一种工具,用于降低这些回忆整理时的复杂度。
大模型日报(6月17日 资讯篇)https://bellybook.cn/
02

Teameet

Teameet 是一个人工智能驱动的视频会议平台,提供了一项突破性的新功能 – 实时语音翻译。这个功能能够保留说话者的语气、音调和情感,让不同语言背景的用户可以进行无缝、自然的跨语言交流,解决了视频会议中常见的语言障碍问题。
大模型日报(6月17日 资讯篇)https://www.teameet.cc/
03

Drip

Drip 是一款由人工智能驱动的自我反思和日记应用程序,旨在帮助用户更好地了解自己的内心世界。它提供了个性化的反思引导和日记写作提示,以及干净简洁的用户界面,通过深入挖掘用户的想法和情感,帮助他们将这些内在体验转化为行动。
大模型日报(6月17日 资讯篇)https://www.about.mydrip.app
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/06/14676.html

Like (0)
Previous 2024-06-16 19:11
Next 2024-06-17 23:37

相关推荐

  • 大模型日报(3月14日)

    特别活动! 欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 资讯 01 智能体的ChatGPT时刻! D…

    2024-03-14
    109
  • 大模型日报(8月8日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-08
    242
  • 大模型日报(8月17~18日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-18
    223
  • 大模型日报(5月18~19日 资讯篇)

    特别活动 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流!…

    2024-05-19
    155
  • 大模型日报(4月19日 资讯篇)

    欢迎观看大模型日报,进入大模型日报群和空间站(活动录屏复盘聚集地)请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 Shumer评价LlaMA…

    2024-04-19
    141
  • 大模型周报:谷歌Gemini生图功能紧急关闭,口碑一夜塌房

    大模型周报由大模型日报精选编辑而成,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 资讯 01 谷歌Gemini生图功能紧急…

    2024-03-02
    188
  • 大模型日报(8月13日 资讯篇)

    特别活动! 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.f…

    2024-08-13
    265
  • 大模型日报(3月28日)

    特别活动! 欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 Databricks上线DBRX…

    2024-03-28
    135
  • 大模型日报(8月7日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-07
    256
  • 大模型日报(3月18日)

    欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 资讯 01 ICLR 2024 | 无需训练,Fast-…

    2024-03-18
    194