大模型日报（7月10日资讯篇）

我们希望能够搭建一个AI学习社群，让大家能够学习到最前沿的知识，大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区：

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」，即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流，欢迎扫码。

欢迎大家一起交流！

资讯

ControlNet作者新项目爆火：仅一张图生成25秒绘画全过程！不到一天GitHub揽星600+

据GitHub主页上的介绍，Paints-Undo的命名有“其绘制过程就像是在绘画软件中多次按下撤消（Undo）按钮”之意。

该项目包含一系列模型，展示了各种人类绘画行为，比如素描、勾线、上色、阴影、变形、左右翻转、调整色彩曲线、改变图层透明度，甚至在绘画过程中改变整体想法等等。

目前发布了两个型号：paints_undo_single_frame和paints_undo_multi_frame。

paints_undo_single_frame为单帧模型，基于SD1.5架构进行了改进，输入为一张图和一个operation step，并输出一张图。

operation step相当于Ctrl+Z（撤销）多少次，比如operation step为100，就相当于会得到一张Ctrl+Z 100次的效果图。

paints_undo_multi_frame是多帧模型，基于VideoCrafter打造，但没有使用原始Crafter的lvdm，所有的训练/推理代码都是从头开始完全实现。

https://mp.weixin.qq.com/s/ssboe4kZL1RHMu_1hduf0Q

Claude编程支持一键共享，第一批网友已经开始晒作品了

Claude 3.5上新的“工坊模式”（Artifacts）再次更新，写完的网页应用支持一键分享了！不用自建服务器，不用部署后台程序，点一下就能自动获得链接。而且被分享的应用还能一键导入自己的对话，分分钟魔改个新版本出来。这也是继3.5这个大版本更新和“工坊模式”上线以来，Claude给广大网友带来的又一次惊喜。

新功能的接连发布，也让网友开始纷纷cue起OpenAI，表示OpenAI你在干啥，现在两家的对比实在是太鲜明了。

https://mp.weixin.qq.com/s/CbRsZ74sgWS8Vn6pIhVx9w

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

在构建 AI 应用时，prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性，需要研究者深入了解应用需求，并具备大型语言模型方面的专业知识。为了加快开发速度并改善结果，AI 初创公司 Anthropic 简化了此流程，可以让用户更轻松地制作高质量的 prompt。

具体来说，研究者为 Anthropic Console 添加了新功能，可以生成、测试和评估 prompt。

Anthropic 提示工程师 Alex Albert 表示：这是他们过去几周投入了大量工作才得到的成果，现在 Claude 在提示工程（Prompt Engineering）方面表现得非常好。

https://mp.weixin.qq.com/s/KL40M1bR3EPlAGWYYEghCg

WAIC观察：隐私计算加速落地产业，全新的技术标准体系呼之欲出

为此，基于《网络安全法》、《个人信息保护法》中设置的「个人信息匿名化条款」指导，对外经济贸易大学、大数据技术标准推进委员会和蚂蚁集团共同撰写了《个人信息匿名化制度：技术与法律（2024）》白皮书。

这是学术与产业界首次联合从技术与法律双重维度对个人信息匿名化问题做系统性梳理与阐释、探寻可落地技术方案与数据流通解决路径。

对外经济贸易大学数字经济与法律创新研究中心主任许可表示，匿名化制度的存而不用已经成为当前推动数据流通复用、发挥数据要素乘数效应的重大障碍之一。

https://mp.weixin.qq.com/s/uFATm6uEP4Wg6PYJFMdVbQ

DeepMind新方法：训练时间减少13倍，算力降低90%

JEST是一种用于联合选择最佳数据批次进行训练的方法。它就像一个智能的图书管理员，在一大堆书（数据）中挑选出最适合当前读者（模型）阅读的几本书（数据批次）。

这样做可以让读者更快地学到知识（训练模型），还能节省时间（减少迭代次数）和精力（减少计算量）。研究显示，JEST大幅加速了大规模多模态预训练，与之前的最先进水平（SigLIP）相比，迭代次数和浮点运算次数减少了10倍。

https://mp.weixin.qq.com/s/8rkE6Rp2yw31gw0XhFcZXg

推特

Lilian Weng新文章：大语言模型的外在幻觉

在7月4日假期期间，写了关于外在幻觉的文章。https://lilianweng.github.io/posts/2024-07-07-hallucination/

以下是ChatGPT建议的有趣推文内容：

🚀 探索AI幻觉的奇妙世界！

🤖 了解LLM如何创造出一些极具创意（有时也很荒谬）的内容。

🌍 学习其成因，发现其特点，并

✨ 探索将AI保持在现实中的最新方法。

https://x.com/lilianweng/status/1810916954133385382

Rachitsky：人工智能距离取代产品经理比我预期的更近

人工智能距离取代产品经理还有多远？

比我预期的更近。

与 @hammer_mt（专业提示工程师和O’Reilly《生成式AI提示工程》一书的合著者）合作，我们开始制定一个基准，来跟踪AI在最常见和最困难的产品经理任务中的表现。在我们的首次尝试中，AI在三分之二的任务中击败了人类，包括制定产品战略 😮

查看我们的方法和令人惊讶的结果：https://lennysnewsletter.com/p/how-close-is-ai-to-replacing-product

https://x.com/lennysan/status/1810686158201901488

Balaji分享Claude Demo：“以100倍的速度从文档到设计再到原型”

是的。现在我们可以以100倍的速度从文档到设计再到原型。

https://x.com/balajis/status/1810338989544816679

Aman Arora分享关于Gemma 2新博客：分组查询注意力、滑动窗口注意力、旋转位置嵌入(RoPE)、对数软上限和模型合并

我很兴奋地分享一篇关于Gemma 2的新博客文章，其中详细介绍了：

分组查询注意力、滑动窗口注意力、旋转位置嵌入(RoPE)、对数软上限和模型合并。

所有这些都附有易于理解的PyTorch实现！

这篇博客文章详细介绍了Gemma 2的架构组件，包括分组查询注意力、滑动窗口注意力、旋转位置嵌入(RoPE)、对数软上限和模型合并，并提供了易于理解的PyTorch实现。分组查询注意力通过减少键值头的数量来降低参数量；滑动窗口注意力将矩阵分块以减少计算量；RoPE在自注意力中引入相对位置依赖；对数软上限提高了训练稳定性；文章还讨论了模型合并技术和指数移动平均(EMA)。这些创新有助于提高模型性能和效率。

https://x.com/amaarora/status/1810447884531466256

Anole：第一个开源的、自回归的原生LMM，用于多模态生成

大型多模态模型的羊驼时刻!我们能否像Llama那样构建用于简单多模态生成的原生LMM?
介绍Anole:第一个开源的、自回归的原生LMM,用于多模态生成。基于@AIatMeta的Chameleon构建:

https://github.com/GAIR-NLP/anole

https://x.com/stefan_fee/status/1810695036432232576

产品

Threado AI

Threado 是一家提供 AI 驱动的客户支持解决方案的公司。他们的产品包括可训练的聊天机器人、集成到工具中的代理助手，以及连接多个数据源的智能知识中心。

https://www.threado.com/

Shram

Shram 是一款游戏化的工作管理工具，让工作管理变得更有趣、有意义和富有成就感。它不仅可以管理项目和任务，还能提供每个团队成员绩效的实时报告，将工作效率与工作成果联系起来，而不仅仅依赖工作时长。Shram 通过任务审批、经验值奖励等游戏化机制，帮助管理者更好地管理团队，也帮助员工更好地管理自己的工作和绩效。

https://www.shram.io/

投融资

Accend获320万美元种子融资

Accend是一家总部位于纽约的公司，专注于帮助金融科技公司和银行加速业务客户的入驻流程。该公司获得了320万美元的种子轮融资，由Adverb Ventures领投，参与者包括Y Combinator、General Catalyst、645 Ventures以及来自Brex、Stripe和Carta的天使投资人。融资将用于扩展运营和开发工作。Accend利用高度可定制的AI模型，为客户提供深入的行业风险洞察，并有效提取财务文件数据，服务对象包括Slope、Pleo和Pliant等欧美客户。

公司官网：https://www.withaccend.com/

https://www.finsmes.com/2024/07/accend-raises-3-2m-in-seed-funding.html

Enso获600万美元种子融资，计划为中小企业引入AI代理

Enso是一家由RapidAPI联合创始人Mickey Haslavsky创办的公司，旨在为中小企业（SMB）提供预编程AI代理以处理重复性任务。该公司宣布获得600万美元种子轮融资，由NFX领投，天使投资人包括Google Research负责人Yossi Matias和前红杉资本GP Shmil Levy。Enso提供70多个行业的AI代理，帮助客户进行SEO管理、Instagram互动、竞争对手追踪等，并以每个代理每月29至79美元的价格提供服务，旨在将企业级AI普及到中小企业。

公司官网：https://enso.bot/

https://techcrunch.com/2024/07/09/with-6m-in-seed-funding-enso-plans-to-bring-ai-agents-to-smbs/

DreamFlare AI视频生成平台获得投资

DreamFlare AI是一家由前Google员工Josh Liss和纪录片制片人Rob Bralver共同创立的初创公司，旨在帮助内容创作者制作和盈利短视频内容。该公司刚刚从隐形模式中脱颖而出，目前已筹集到160万美元的资金。投资方包括FoundersX Ventures。此外，DreamFlare还声称与包括迪士尼、Netflix和环球影业在内的娱乐业高管，以及“奥斯卡和艾美奖得主的电影制片人和节目制作人”达成了创意合作。

公司官网：https://www.dreamflare.ai/