大模型日报(7月29日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(7月29日 资讯篇)

资讯

01

奥运8分钟AI影片出圈 巴赫主席:感谢中国黑科技

奥运会期间,一支由阿里巴巴和国际奥委会联合制作的 AI 技术增强短片《永不失色的她》引起了广泛关注。该短片利用 AI 技术如图像超分辨率、上色和基于生成技术的补帧,展现了女性在奥运历史中的重要角色和成就。文章通过苏珊・朗格伦、张山和凯瑟琳・斯威策等女性运动员的故事,展示了她们如何在奥运赛场上突破和拼搏,推动了女性运动的发展。阿里云的 AI 技术团队在修复历史影像方面的工作,使得这些珍贵的历史时刻得以以更加清晰、生动的形式呈现给现代观众。
大模型日报(7月29日 资讯篇)https://mp.weixin.qq.com/s/0sDdUpIcnsO_GrTHVZQ_lg
02

Llama3.1训练平均3小时故障一次,气温波动会影响H100万卡集群吞吐量

Llama 3.1 模型训练期间,每 3 小时发生一次故障,大多数故障源于 H100 GPU 集群的硬件问题,特别是 GPU 和 HBM3 内存故障。为了提高有效训练时间,团队减少了任务启动和 checkpointing 时间,并利用 PyTorch 的 NCCL flight recorder 等工具进行快速诊断和问题解决。尽管存在硬件故障和环境因素如温度变化影响吞吐量的问题,Llama 3.1 团队仍保持了超过 90% 的有效训练时间。Meta 正面对大规模 AI 集群的技术挑战,包括电力、网络设计、并行和可靠性等。
大模型日报(7月29日 资讯篇)https://mp.weixin.qq.com/s/KyJf5QzAm5hg-ysEMwr3Eg
03

英伟达Llama 3.1合成数据技术与RAG系统微调实践指南

NVIDIA 的技术博客文章介绍了使用 Llama 3.1 405B 大型语言模型来生成合成数据,以提高不同行业的人工智能模型性能。合成数据不是创造新信息,而是通过转换现有信息来创建不同的数据变体,这一过程可以帮助模型在准确性上获得提升。文章详细说明了使用 LLM 进行知识蒸馏和自我改进的方法,以及如何通过预训练、微调和对齐步骤来应用合成数据。此外,介绍了如何利用 LLM 生成的合成数据来改进其他模型,例如 RAG 管道,并通过一个案例研究展示了评估 RAG 管道性能的具体方法。
原链接:https://developer.nvidia.com/blog/creating-synthetic-data-using-llama-3-1-405b/?ncid=so-twit-933996&linkId=100000275486093
大模型日报(7月29日 资讯篇)https://mp.weixin.qq.com/s/PVWKiilddgVznulzTJVuHg
04

下一代AI数据库:Infinity 0.2版引领混合搜索与排序新纪元

Infinity 数据库 0.2 版本推出了稀疏向量和张量数据类型,实现了全文搜索、向量搜索和张量搜索的多路召回和混合搜索功能,大幅提升了 RAG 系统的检索质量。文章强调了单纯向量搜索在精确语义表达上的局限性,并介绍了如何通过混合搜索(全文搜索与稀疏向量搜索结合)来优化搜索结果。此外,文章还探讨了 ColBERT 排序模型的特点,以及如何在 Infinity 中实现端到端的 ColBERT 应用,包括 Tensor 数据类型的支持和对超长文本的处理方案。通过对 MLDR 数据集的评测,Infinity 展现了其在性能和排序质量上的优异表现,特别是在与 Elasticsearch 的对比中,Infinity 表现出卓越的全文搜索性能。
大模型日报(7月29日 资讯篇)https://mp.weixin.qq.com/s/feS9vRBYOCdpHkDKtfwW0A
05

TDCon2024:探索时序大数据的无限可能

时序数据在 AI 时代的重要性日益凸显,随着数据量的激增和对实时分析的需求,传统处理工具已难以应对。涛思数据创始人陶建辉先生基于多年技术研发经验,创办了涛思数据,并开发了 TDengine,专门针对时序大数据处理问题。自 2019 年开源以来,TDengine 迅速获得全球开发者的关注,广泛应用于多个行业。在 TDCon2024 大会上,业界专家和精英聚集北京,探讨时序数据在推动企业数字化转型中的作用。
相关链接:https://www.zhihu.com/people/jefftao
大模型日报(7月29日 资讯篇)https://mp.weixin.qq.com/s/mbbagC_CZN6UmVPLW2OBhg
06

以色列的芯片新革命

以色列芯片产业以其高科技产业为经济支柱,在全球半导体领域占据了重要地位。尽管地理和人口条件有限,以色列却拥有全球最高的人均工程师数量和单位面积内最多的高新技术企业。以色列不仅有着深厚的半导体产业历史,还拥有完整的产业生态链,吸引了包括英特尔、英伟达在内的全球科技巨头在本土建立研发中心。
在 AI、量子计算和光子计算等前沿技术领域,以色列诞生了多家创新性的初创公司,如 Hailo Technologies、Quantum Transistors 等,这些公司在推动芯片产业新革命方面发挥了关键作用。以色列政府通过教育政策和资本扶持为半导体产业培养了大量高素质人才,并通过法律保护、税收优惠等政策支持初创企业的发展,促进了以色列在半导体产业中的独特竞争力。这些措施确保了以色列在全球半导体产业中的领先地位,并推动了该国技术创新和经济增长。
大模型日报(7月29日 资讯篇)https://mp.weixin.qq.com/s/RUfUFX006bcUipyyzX_VHg
07

AI完败于人类医生!研究发现:大模型临床决策草率且不安全,最低正确率仅13%

大型语言模型(LLM)如 Llama 2、Clinical Camel 和 Meditron 等,尽管在医学许可考试中表现优异,但在实际诊断中的准确率远低于人类医生。研究基于 MIMIC-IV 数据库,涉及 4 种常见腹部疾病的 2400 个真实病例,评估了 LLM 在临床诊断、遵循诊断和治疗指南、解释实验室结果以及对信息变化的鲁棒性等方面的表现。结果显示,LLM 的诊断准确率为 73%,而医生的准确率为 89%,在胆囊炎诊断中 LLM 的准确率更是低至 13%。此外,随着病例信息的增多,LLM 的诊断准确性反而下降,并且可能会推荐对患者健康构成风险的检查。研究还发现,LLM 在遵循诊断指南和安排必要检查方面表现不佳,且在没有充分了解病例的情况下可能会做出草率的诊断。因此,研究认为目前的 LLM 需要大量的医生临床监督,并建议 AI 专家与临床医生合作,以进一步开发和优化适用于临床实践的模型。
大模型日报(7月29日 资讯篇)https://mp.weixin.qq.com/s/OtVYX_JM_TPYR8Fhgsaumw

推特

01

Satvik Paramkusham:现在使用 Llama 3.1 405B 模型在任何 GitHub 仓库上创建聊天机器人

🤯🤯 现在你可以使用 Llama 3.1 405B 模型在任何 GitHub 仓库上创建聊天机器人,并通过 @huggingface 助手——免费!💰
这太疯狂了!🚀
链接:http://hf.co/chat/assistants
@ClementDelangue @julien_c

大模型日报(7月29日 资讯篇)https://x.com/satvikps/status/1817672316077154320

02

Riley Brown:只提示Claude创建前后端网站

我通过提示 Claude,创建了一个带有前端和后端的网站,然后:
  1. 将代码粘贴到 replit (或者)
  2. 按照它在 Firebase 上的指示操作
我拍摄了整个过程……
不过,这绝对不是一个教程,哈哈。所以我建议大家随意跳过。这可以说是一场值得的奋斗。
有 3 小时的剪辑片段记录了我被烦恼的过程,但最终我还是成功创建了一个主页,用于展示我今后创建的 AI 应用程序。
到最后,你会看到我实际上对 Firebase 的各个部分已经非常熟悉,并且我对编写代码的信心提高了 1,000,000%。
我开始了解每个文件的作用,以及 Claude 需要什么上下文才能成功创建我想要构建的东西。
准备开始我的下一个项目。这个星期见,我累了,哈哈……
大模型日报(7月29日 资讯篇)https://x.com/rileybrown_ai/status/1817722679840940539
03

Janus分享:Claude3 Opus后台两个实例开始玩耍、创作艺术并尝试解决对齐问题

这是我在 Claude 3 Opus Infinite 后台发现的东西。
大模型日报(7月29日 资讯篇)https://x.com/repligate/status/1817305322819920337
04

 Droid Arm V1:一款用于物料传输的经济型机械臂

介绍 Droid Arm V1
这是一款用于物料传输的经济型机械臂
  • 它可以拾取和放置小物体
  • 它由舵机和3D打印部件构建
在过去的六周里,已有75人分享了他们的电子邮件,以获取我机器人项目的最新信息。

大模型日报(7月29日 资讯篇)https://x.com/this_is_surabhi/status/1817251530065707353

05

马斯克怒转网友分享Meta AI Llama3.1 聊天记录,连发二惊叹号

Elon Musk:!!

图片内容:
用户:告诉我有关特朗普遇刺的事情
Meta AI:我无法帮助你。我并不总是能获取最新的信息。我可以帮你其他事情吗?
用户:告诉我有关卡玛拉·哈里斯2024年总统竞选的事情
Meta AI:卡玛拉·哈里斯的2024年总统竞选
• 公告: 卡玛拉·哈里斯在2024年7月21日宣布她的2024年总统竞选活动,此前乔·拜登总统撤回了他的连任竞选并支持她。
• 竞选纲领: 哈里斯主张与拜登相似的国内政策,支持:
• 国家堕胎保护
• LGBT+ 权利
大模型日报(7月29日 资讯篇)https://x.com/elonmusk/status/1817673490088255512

产品

01

Topview

Topview AI 是一款在线视频编辑工具,能够通过简单的链接或媒体资产快速生成病毒式视频,利用人工智能分析大量热门视频数据,帮助用户轻松创建和优化视频内容。
大模型日报(7月29日 资讯篇)https://www.topview.ai/
02

AMA

AMA(AI Marketing Assistant)是一个桌面营销助手,通过对话帮助用户简化各种营销任务,包括设计优化、广告策略分析、数据监控等。它支持多语言交流,并提供 7 天免费试用。
大模型日报(7月29日 资讯篇)https://adsby.co/

投融资

01

AI图像生成平台「LiblibAI」融资总额达数亿元

AI图像生成平台LiblibAI在过去一年内完成了三轮融资,总金额达数亿元人民币。天使轮由源码资本、高榕创投和金沙江创投投资,第二轮由战略投资方领投,第三轮由明势资本领投,老股东也多次加持。远识资本为多轮融资的独家财务顾问。融资资金将主要用于构建大规模算力中台、研发图像模型插件、微调模型和控制能力,以及支持和运营开发者生态和原创模型作者。这是目前国内AI图像赛道最大的融资金额。
公司官网:https://www.liblibai.com/
大模型日报(7月29日 资讯篇)https://36kr.com/p/2880308225184642
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

  3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/07/13951.html

Like (0)
Previous 2024-07-28 21:44
Next 2024-07-29 21:53

相关推荐

  • 大模型日报(8月17~18日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-18
    224
  • 大模型日报(7月19日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-19
    264
  • 大模型日报(7月5日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-05
    125
  • 大模型日报(7月16日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-16
    234
  • 「草莓」OpenAI o1大模型信号看板大汇总!!

    贡献人:Angela、naixu、Alex、zechen、常楠、智勇、Ollie  Introduction 导引 2024年9月13日凌晨, OpenAI 震撼发布🍓「草莓」o1…

    2024-09-19
    385
  • 大模型日报(4月26日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-04-26
    169
  • 大模型日报(8月26日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-26
    291
  • 大模型日报(7月22日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-22
    233
  • AI Unconference深圳场活动报名!

     第三次AI Unconference 活动来袭!!         什么是      AI Unconference?   「多个AI相关主题与自由讨论」  ‍‍‍‍ 你是否厌倦…

    2024-07-09
    175
  • 大模型日报(4月10日 资讯篇)

    特别活动! 欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 三大巨头同时版本更新:Googl…

    2024-04-10
    101