大模型日报（8月15日资讯篇）

特别活动！

我们希望能够搭建一个AI学习社群，让大家能够学习到最前沿的知识，大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区：

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」，即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流，欢迎扫码。

欢迎大家一起交流！

资讯

创业一年，人间三年

李沐在文章中分享了他创业一年的经历，体验到了时间的加速效应，感觉像是人生中经历了三年。他谈到了命名公司时的困惑与灵感，融资过程中的起伏，以及 GPU 采购时的挑战与成功。在商业和技术层面，他强调了自定义大型语言模型（LLM）的重要性，以及公司在行业中的定位和发展。同时，他也反思了如果更加积极地融资，可能会获得更多资金的机会。技术上，他描述了对 LLM 认知的四个阶段，从最初的震撼到后来的深入研究和定制模型的成功，最终实现了与行业领头羊相当甚至更优的技术水平。最后，李沐提出了他对未来智能体的愿景，即作为人类的陪伴，不仅具备高情商和智商，还能够提供情感和知识上的支持。他认为，生产工具的发展将使人类更加个体化和独立，而智能体能够填补这种孤独带来的空缺。在团队和个人追求方面，他强调了团队的重要性以及内心动机对于创业成功的影响。

https://zhuanlan.zhihu.com/p/714533901?utm_psn=1807446872983478272

GitHub 全球宕机，Copilot 瘫痪！开发者光明正大摸鱼

GitHub 近期遭遇全球性宕机，影响了其网站及多项服务，包括 Copilot，虽后续系统恢复正常。宕机期间，用户无法访问主网站，显示错误消息。受影响的服务包括 pull requests、GitHub Pages 和 API。事件迅速扩散，超过 1 万用户受牵连。GitHub 在 2018 年被微软收购，用户数从不到 4000 万增长至 7300 多万，但宕机事件频发，尤其在 2018 年和 2021 年发生了严重的中断，导致开发者对 GitHub 的信任下降。用户通过社交平台表达了对 GitHub 服务不稳定性的不满，认为即使是短时间的中断也是不可接受的。

https://mp.weixin.qq.com/s/wweSVOjs1jCZLWKPpKMdDA

ACL主席：ACL不是AI会议

ACL 主席 Emily M. Bender 在 ACL 2024 大会上指出，ACL 大会是计算语言学和自然语言处理领域的顶级国际会议，而非 AI 会议。她强调 ACL 的核心在于语言技术和计算语言学，并批评了 AI 领域的一些不良研究实践，如过度追求与 SOTA 模型的比较评估和基准测试的不当使用。Bender 主张 CL/NLP 研究应关注技术的适用性、对人类语言行为的理解、以及科学研究的可复制性和可重现性。她认为 ACL 应该是一个促进跨学科研究、关心语言群体的平台，并提供对社会影响的理性讨论。这一观点引发了社交平台上的广泛讨论，有人认为这种分割没有必要，而另一些人则理解 Bender 的立场，担心 AI 的风头可能会使其他领域的研究受到冷落

https://mp.weixin.qq.com/s/9M50mfCiH3HF-UzKTRsLgA

ACL 2024大奖揭晓！全华人团队用AI破解3000年前甲骨文密码

ACL 2024 大会揭晓了多项关键研究成果，特别是全华人团队利用扩散模型成功破译 3000 年前甲骨文的工作。该团队开发了「Oracle Bone Script Decipher」（OBSD），通过基于条件扩散的策略生成了破译线索，为古代语言分析提供了新方法。此外，研究人员还探讨了大型语言模型的记忆特性，发现模型的记忆性能随模型大小、数据顺序和学习率而变化，且具有一定的可预测性。Cohere 公司发布的 Aya 模型覆盖了超过 101 种语言，显著超越了现有开源模型，为多语言语言模型的研究提供了新的基准。另一研究探讨了 Transformer 模型在学习复杂函数时的偏差和局限性，指出这些偏差与模型的损失景观密切相关。

https://mp.weixin.qq.com/s/CJEDRuEb19buOOk4FsvQNQ

Chrome安卓或遭剥离，AI训练数据被迫共享

谷歌可能因违反反垄断法而面临分拆，包括与 Chrome 和安卓操作系统的解绑，以及被迫共享 AI 训练数据。这将是自 80 年代 AT&T 分拆以来最重大的企业分拆。谷歌搜索引擎市场份额约为 91%，长期保持在约 90%，而次一位的微软 Bing 仅占不到 4%。谷歌通过与苹果、三星等公司的协议，将其搜索引擎作为默认选项预装于设备上，维持其市场霸权。美国司法部胜诉，联邦法官裁定谷歌违反反垄断法，可能导致谷歌剥离安卓或 Chrome 浏览器。此外，司法部考虑要求谷歌与竞争对手分享数据，以促进市场公平竞争。如果分拆执行，将对谷歌的广告业务和市值产生深远影响。谷歌还可能被迫出售 AdWords 广告平台，或者提供互通操作，使其在其他搜索引擎上可用。此外，谷歌可能需要为其 AI 产品和搜索新功能的开发提供解释，以抵御垄断争议。

https://mp.weixin.qq.com/s/16ig3q2jkR7kevfHJ7wfHg

专访大象机器人 CEO 宋君毅：从机械臂到轮式人形机器人，差异化才能突围

大象机器人 CEO 宋君毅在机器人领域的创业旅程，从 2016 年开始，经历了从工业机械臂到轻量型机械臂、机器宠物，再到人形机器人的多次业务转型。他坚持技术自研，不断调整产品布局，以适应市场需求和竞争环境。在 2020 年，推出的桌面级六轴机械臂 myCobot 使公司实现了亏转盈。随后，公司扩展了轻量级机械臂和机器宠物系列，并在 2024 年全面布局人形机器人。宋君毅认为，人形机器人的未来市场前景广阔，重点在于性价比和应用场景的拓展。通过深入理解用户需求，大象机器人致力于推动人形机器人的商业化落地，以实现公司的持续发展和转型。

https://mp.weixin.qq.com/s/sU2ZrURDVUd-91rHoeUuQw

推特

AI + Web3初创Sahara AI 融资4300万美元：带入一个开放、公平、安全的AI未来

Sahara AI成功筹集了4300万美元，用于构建协作型AI经济体！

由@PanteraCapital、@BinanceLabs 和 @polychain 共同领投，此次融资将我们带入一个开放、公平、安全的AI未来，通过我们的去中心化AI区块链平台实现。

我们还看到了来自@SamsungNext、@Sequoia、@matrixvc、@daofive、@geek_cartel、@NomadCapital_io、@SCB10X_OFFICIAL、@CanonicalCrypto、@mirana、@ForesightVen、@aegis_ventures、@DispersionVC、@tangent_xyz、@alumniventures等的参与。

此外，我们很自豪能够得到AI领域最聪明的头脑的支持，包括：

来自@MothersonGroup 的 Laksh Vaaman Sehgal
来自@AnthropicAI 和 @StanfordAILab 的 Rohan Taori (@rtaori13)
来自@NousResearch 的 Teknium (@Teknium1)
来自@togethercompute 的 Vipul Prakash (@vipulved)
来自@midjourney 的 Elvis Zhang (@elvzhangg)，等等

无论你是AI爱好者、数据科学家、商业领袖，还是对技术改变世界的潜力充满热情的人，协作型AI经济体都有你的一席之地！

阅读更多关于如何加入我们的使命：

http://saharalabs.ai/blog/sahara-ai-raise-43m

https://x.com/SaharaLabsAI/status/1823708561517764866

Anthropic大更新：Claude可以进行提示缓存，使用更长、更具指导性的提示即时微调模型响应

使用Claude进行提示缓存。

缓存允许您使用更长、更具指导性的提示即时微调模型响应——同时最多减少90%的成本。

现在在Anthropic API的测试版中可用。

https://x.com/AnthropicAI/status/1823751314444021899

《提高LLM应用的准确性》：创建评估数据集来测量模型准确性、添加提示工程和自我反思、微调模型等

学习一种开发模式，以系统地提高LLM应用的准确性和可靠性，在我们的新短期课程中，与@LaminiAI和@Meta合作建立的《提高LLM应用的准确性》，由Lamini的CEO @realSharonZhou 和Meta的合作工程高级总监 @asangani7 教授。（披露：我是Lamini的投资者。）

调整LLM应用的路径可能很复杂。在这门课程中，你将学习一系列系统的步骤来提高准确性，通过减少幻觉：

• 创建评估数据集来测量模型准确性

• 添加提示工程和自我反思

• 微调你的模型，包括“记忆调整”，这是一种在LLM中嵌入事实的新方法

使用Llama 3-8B参数模型，你将：

• 构建一个具有自定义模式的文本到SQL代理，并模拟它产生幻觉的情况

• 理解指令微调与记忆微调的区别，指令微调是对预训练LLM给出遵循的指令

• 了解如何通过性能高效的微调（PEFT）技术，如低秩适应（LoRA）将训练时间减少100倍，以及记忆专家混合（MoME）进一步减少训练时间

我很欣赏Meta发布了Llama的开放模型家族——这门课程展示了开发者可以用这些模型做的独特类型的工作。

https://x.com/AndrewYNg/status/1823759268937650528

Bihan分享语音到语音管道迭代：延迟可达500毫秒

介绍我们的第一个语音到语音管道迭代 🗣️。

选择你想要的LLM，并与之对话，延迟可达500毫秒！谁说我们需要语音到语音模型快速呢？

https://x.com/eustachelb/status/1823817160210440196

3D导出功能：将任何图像转换为3D资产

在 @everartai 上推出3D导出功能 🧊

现在，您可以将任何图像转换为3D资产，以便与您喜爱的工具一起使用。

此视频中的生成是实时的。

就是这么快。⚡️

结合使用FLUX 1. Pro，您将获得一款适用于任何类型资产的惊人工具。

https://x.com/skirano/status/1823778193972576521

Subform：用于分支和混合AI聊天的画布

介绍Subform——一个用于分支和混合AI聊天的画布。

仅用两周时间和400美元的Claude积分，加上血汗和泪水就构建完成

https://x.com/bnj/status/1823784845879005407

产品

GCA

GCA（GPT 计算机助手）是一个开源框架，帮助用户为产品创建高度自定义的智能系统，支持 Windows、Linux 和 MacOS。它提供丰富的 API 和代理基础设施，适用于 B2B SaaS、电子商务和开发工具等多种场景，能够快速响应用户需求，提升 AI 输出质量，推动 AI 技术的民主化。

https://gca.dev/

ToonTalk

ToonTalk 是一款专为儿童设计的 AI 朋友，能够分享有趣的故事、回答孩子的疑问，并鼓励语音互动，减少屏幕时间。它具有安全性和教育性，提供父母控制功能，帮助家长更好地理解孩子的情感和需求。

https://flux-ai.io/flux-ai/

投融资

李飞飞创立的AI初创公司World Labs获1亿美元融资，估值超10亿美元

著名斯坦福大学AI教授李飞飞创立的World Labs在成立仅四个月内获得了两轮融资。最新一轮融资由NEA领投，金额达1亿美元，使公司估值超过10亿美元。此前的第一轮融资在4月份进行，估值为2亿美元，投资方包括Andreessen Horowitz和Radical Ventures。World Labs致力于开发三维物理建模的AI技术，用于游戏和机器人领域。