大模型日报（8月29日资讯篇）

我们希望能够搭建一个AI学习社群，让大家能够学习到最前沿的知识，大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区：

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」，即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流，欢迎扫码。

欢迎大家一起交流！

资讯

OpenAI即将完成新一轮融资！估值超过1000亿美元

据彭博社报道，OpenAI即将完成新一轮融资，由Thrive Capital领投，估值超过 1000 亿美元。Thrive 将在本轮融资中投资约 10 亿美元。OpenAI 首席财务官Sarah Friar周三在一份备忘录中告诉员工，公司正在寻求新资本，但没有透露细节。

知情人士去年年底向彭博新闻社透露，OpenAI 至少从 12 月就开始接触投资人，预期以 1000 亿美元或以上的估值进行融资。

知情人士称，Friar 在给员工的备忘录中表示，这笔融资将支持公司的计算能力和其他运营费用。另外，OpenAI 计划在今年晚些时候举行一场招标活动，员工将有机会出售部分股份。

Thrive Capital 是一家成立于2009年的风投公司，总部位于纽约。该公司专注于投资互联网、软件和技术赋能领域的公司。据PitchBook的数据，Thrive Capital至今已经进行了393项投资。

2024年8月18日的报道显示，Thrive Capital最近完成了其第九期旗舰基金的募集，募集金额超过50亿美元，这将是当年募集金额最高的风险投资基金之一，仅次于a16z上半年募集的72亿美元基金。

此外，Thrive Capital的创始人约书亚·库什纳（Joshua Kushner）是一位85后新生代投资人，他也是亿万富翁家族库什纳家族的一员，家族拥有大型房地产开发商库什纳集团。

2023年10月，Thrive Capital曾牵头从OpenAI的员工处购买老股，估值为800亿美元。

相关链接：https://www.bloomberg.com/news/articles/2024-08-28/openai-nears-funding-round-at-more-than-100-billion-valuation?srnd=phx-technology

https://techcrunch.com/2024/08/28/openai-reportedly-in-talks-to-close-new-funding-round-at-100b-valuation/

MidJourney进军硬件市场，引发业界关注

MidJourney，这家以AI图像生成平台闻名的公司，近日宣布将进军硬件领域。据报道，该公司在没有接受任何风险投资的情况下，年收入已超过2亿美元。MidJourney的新硬件团队将设立在旧金山，这一消息在社交平台X上公布。

关于MidJourney可能涉足的硬件方向，业内推测与该公司2月份招聘的Ahmad Abbas有关。Abbas此前曾参与苹果Vision Pro混合现实头显的开发，而MidJourney的CEO David Holz也是硬件领域的老手，曾共同创立了Leap Motion，一家专注于动作跟踪外设的公司。

尽管MidJourney因其AI训练方法正面临法律诉讼，该公司仍在持续开发AI模型，涉及视频和3D生成。硬件的开发或许与这些努力有关，可能用于提升其AI模型的性能或用户体验。

https://techcrunch.com/2024/08/28/midjourney-says-its-getting-into-hardware/

NVIDIA发布2025财年第二季度财报

2024年8月28日，NVIDIA公布了截至2024年7月28日的2025财年第二季度财报，报告显示该公司在多个方面创下新纪录。本季度总收入达到300亿美元，较上一季度增长15%，同比增长122%。数据中心业务收入达到263亿美元，同比增长154%。此外，NVIDIA的GAAP和非GAAP稀释每股收益分别为0.67美元和0.68美元，同比分别增长168%和152%。

主要业绩亮点

数据中心业务：数据中心收入创纪录，达到263亿美元，同比增长154%。NVIDIA的H200 Tensor Core和Blackwell架构在MLPerf基准测试中表现出色，进一步提升了公司的技术领先地位。
游戏和AI PC：本季度游戏收入为29亿美元，同比增长16%。NVIDIA还推出了ACE和Project G-Assist等AI技术，进一步增强了游戏体验。
专业可视化：收入为4.54亿美元，同比增长20%，推出了用于OpenUSD的生成式AI模型，以加速工业数字孪生和机器人开发。
汽车与机器人：汽车业务收入达到3.46亿美元，同比增长37%。NVIDIA还展示了Isaac机器人平台在全球领先企业中的应用。

股东回报与展望 NVIDIA在上半年通过股票回购和现金分红向股东返还了154亿美元。公司董事会批准了额外500亿美元的股票回购授权。本季度，NVIDIA的现金股息为每股0.01美元。此外，公司预计2025财年第三季度收入将达到325亿美元，并继续保持强劲的利润率。

新产品与技术NVIDIA推出了包括Blackwell系统和Spectrum-X以太网平台在内的多项新产品，并宣布与Hugging Face合作推出推理服务，加速生成式AI的应用。

https://nvidianews.nvidia.com/news/nvidia-announces-financial-results-for-second-quarter-fiscal-2025

AI推理竞争白热化：Nvidia Blackwell、AMD、Google及新兴公司首秀MLPerf基准测试

近日，ML Commons发布了最新一轮的AI推理竞赛MLPerf Inference v4.1结果。此次比赛首次包含了Nvidia全新Blackwell芯片、AMD Instinct加速器、Google Trillium加速器以及初创公司UntetherAI的产品。尽管Nvidia在AI训练领域仍然占据主导地位，但在推理方面，其他公司尤其是在能效方面正在逐步赶上。

Nvidia的Blackwell芯片在大语言模型（LLM）问答任务中表现突出，其单个加速器性能较之前的版本提升了2.5倍。Blackwell成功的原因之一是其首次在MLPerf基准测试中展示了4位浮点精度运算，这大幅提高了计算速度。同时，Blackwell芯片的内存带宽几乎翻倍，达到8TB/s，相比前代H200的4.8TB/s有显著提升。此外，Blackwell支持多达18个NVLink连接，带宽总量达到1.8TB/s，进一步增强了其扩展能力。

Untether AI凭借其speedAI240 Preview芯片在能效方面表现尤为出色。该芯片采用“内存计算”架构，将处理器与内存单元直接相邻分布，大幅减少了数据传输所需的时间和能量消耗。在MLPerf的图像识别任务中，Untether AI的芯片在每瓦特查询次数上远超Nvidia的H200，展示了显著的能效优势。此外，该芯片在低功耗情况下的延迟性能也显著优于Nvidia的L40S。

虽然Cerebras和FuriosaAI未参与此次MLPerf竞赛，但两家公司分别在IEEE Hot Chips会议上推出了新的推理芯片。Cerebras的新服务CS3在LLM生成速度上自称超越Nvidia H100七倍。而FuriosaAI则展示了其第二代芯片RNGD，采用独特的张量收缩处理器（TCP）架构，在推理过程中更高效地利用张量的并行性和数据重用能力。

链接：https://spectrum.ieee.org/new-inference-chips

https://mp.weixin.qq.com/s/cx-otFn6orFeEEZZqEt3kw

RL教父Sutton持续反向传播算法登Nature

这篇《Nature》发表的研究论文《Loss of plasticity in deep continual learning》探讨了深度学习在持续学习环境中的可塑性丧失问题。传统深度学习方法通常在训练阶段更新网络权重，而在使用或评估阶段则保持权重不变，这与许多需要持续学习的应用程序不符。研究发现，标准的深度学习方法在持续学习环境中逐渐失去可塑性，最终表现与浅层网络无异。通过实验，研究表明，只有通过持续向网络注入多样性的算法，才能维持可塑性。

研究提出了「持续反向传播算法」，这是反向传播的一种变体，旨在通过随机初始化部分神经元来维持网络的可塑性和学习能力。实验结果显示，常规的梯度下降方法不足以应对持续学习的需求，需要引入随机、非梯度的成分以保持可变性。研究使用经典的 ImageNet 数据集，通过设计一系列二元分类任务，展示了在持续学习中标准深度学习方法的性能下降问题。

该研究发现，一些流行的方法如 Adam、Dropout 和归一化实际上加剧了可塑性的丧失，而 L2 正则化在某些情况下可以减少这种损失。此外，持续反向传播通过选择性地重新初始化低效单元，并结合传统反向传播和随机性成分，有效地保持了网络的学习能力。研究还通过对 CIFAR-100 数据集进行类别增量学习的实验，验证了持续反向传播算法在多任务环境中的优势。最终，该方法在各类实验中表现出了优异的学习效果，为解决持续学习中的可塑性丧失问题提供了新的思路。

https://mp.weixin.qq.com/s/jeqXj3ez5DbItS7RpoVaSg

陶哲轩IMO演讲全文

陶哲轩在IMO 2024演讲中，回顾了计算机和人工智能在数学研究中的应用历程，并展望了未来的发展。他强调，虽然AI在数学领域的作用日益显著，但人类的洞察力和创造力依然不可替代。演讲内容涵盖了从早期机械计算到现代AI辅助的演变过程。

他特别提到现代AI工具，如DeepMind的AlphaGeometry，以及形式化证明助手（如Lean）的发展。陶哲轩还分享了一些重要的数学突破，如四色定理和开普勒猜想的计算机辅助证明，展示了AI如何帮助处理复杂的数学问题。

然而，他也指出AI的局限性，目前的AI在数学研究中主要扮演辅助角色。尽管AI可以生成有价值的数学猜想，证明过程仍需要人类的介入。陶哲轩对未来充满期待，他认为随着AI技术的发展，将来有可能实现规模更大、更复杂的数学运算，开启数学研究的新篇章。

https://mp.weixin.qq.com/s/GjJgHnl6tBBN1cRzDLXYag

推特

24小时内自动申请了1000份工作并获得了50次面试机会：LinkedIn_AIHawk，批量申请的同时保证质量

有人使用AI机器人在24小时内自动申请了1000份工作，并获得了50次面试机会！🤯

而且这个机器人的代码在GitHub上是开源的。👨🔧

这个工具可以自动化你的LinkedIn求职和申请流程。

扫描符合你条件的职位空缺，
使用LinkedIn的“Easy Apply”功能进行职位申请，
生成定制的简历，
使用大语言模型（LLM）个性化回应雇主问题，
可以批量申请，同时保持质量控制，
安全管理你的数据，并与OpenAI的API集成，提供AI驱动的功能。

https://x.com/rohanpaul_ai/status/1828598009673683347

利用Gemini进行大型多模态模型提示

探索我们全新短课程《利用Gemini进行大型多模态模型提示》，由Erwin Huizenga与@googlecloud合作授课，了解最先进的多模态提示技术。

本课程中的一个有趣见解是：在多模态模型中，提示结构至关重要。例如，在输入文本信息（如患者的病史）之前输入图像（如X光片），可以增强模型对视觉数据的上下文理解和解释能力。在其他场景下，例如图像描述，先放置图像可能会产生更好的效果。多模态模型的行为与纯文本大语言模型不同，有效的提示方式取决于您使用的模型类型。在本课程中，您将学习如何有效地为Gemini模型进行提示。

Gemini的多模态功能还使AI应用开发有了新的方法，例如：