大模型日报(8月29日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(8月29日 资讯篇)

资讯

01

OpenAI即将完成新一轮融资!估值超过1000亿美元

据彭博社报道,OpenAI即将完成新一轮融资,由Thrive Capital领投,估值超过 1000 亿美元。Thrive 将在本轮融资中投资约 10 亿美元。OpenAI 首席财务官Sarah Friar周三在一份备忘录中告诉员工,公司正在寻求新资本,但没有透露细节。
知情人士去年年底向彭博新闻社透露,OpenAI 至少从 12 月就开始接触投资人,预期以 1000 亿美元或以上的估值进行融资。
知情人士称,Friar 在给员工的备忘录中表示,这笔融资将支持公司的计算能力和其他运营费用。另外,OpenAI 计划在今年晚些时候举行一场招标活动,员工将有机会出售部分股份。
Thrive Capital 是一家成立于2009年的风投公司,总部位于纽约。该公司专注于投资互联网、软件和技术赋能领域的公司。据PitchBook的数据,Thrive Capital至今已经进行了393项投资 。
2024年8月18日的报道显示,Thrive Capital最近完成了其第九期旗舰基金的募集,募集金额超过50亿美元,这将是当年募集金额最高的风险投资基金之一,仅次于a16z上半年募集的72亿美元基金 。
此外,Thrive Capital的创始人约书亚·库什纳(Joshua Kushner)是一位85后新生代投资人,他也是亿万富翁家族库什纳家族的一员,家族拥有大型房地产开发商库什纳集团。
2023年10月,Thrive Capital曾牵头从OpenAI的员工处购买老股,估值为800亿美元。
相关链接:https://www.bloomberg.com/news/articles/2024-08-28/openai-nears-funding-round-at-more-than-100-billion-valuation?srnd=phx-technology
https://techcrunch.com/2024/08/28/openai-reportedly-in-talks-to-close-new-funding-round-at-100b-valuation/
02

MidJourney进军硬件市场,引发业界关注

MidJourney,这家以AI图像生成平台闻名的公司,近日宣布将进军硬件领域。据报道,该公司在没有接受任何风险投资的情况下,年收入已超过2亿美元。MidJourney的新硬件团队将设立在旧金山,这一消息在社交平台X上公布。
关于MidJourney可能涉足的硬件方向,业内推测与该公司2月份招聘的Ahmad Abbas有关。Abbas此前曾参与苹果Vision Pro混合现实头显的开发,而MidJourney的CEO David Holz也是硬件领域的老手,曾共同创立了Leap Motion,一家专注于动作跟踪外设的公司。
尽管MidJourney因其AI训练方法正面临法律诉讼,该公司仍在持续开发AI模型,涉及视频和3D生成。硬件的开发或许与这些努力有关,可能用于提升其AI模型的性能或用户体验。
大模型日报(8月29日 资讯篇)https://techcrunch.com/2024/08/28/midjourney-says-its-getting-into-hardware/
03

NVIDIA发布2025财年第二季度财报

2024年8月28日,NVIDIA公布了截至2024年7月28日的2025财年第二季度财报,报告显示该公司在多个方面创下新纪录。本季度总收入达到300亿美元,较上一季度增长15%,同比增长122%。数据中心业务收入达到263亿美元,同比增长154%。此外,NVIDIA的GAAP和非GAAP稀释每股收益分别为0.67美元和0.68美元,同比分别增长168%和152%。
主要业绩亮点
  • 数据中心业务:数据中心收入创纪录,达到263亿美元,同比增长154%。NVIDIA的H200 Tensor Core和Blackwell架构在MLPerf基准测试中表现出色,进一步提升了公司的技术领先地位。
  • 游戏和AI PC:本季度游戏收入为29亿美元,同比增长16%。NVIDIA还推出了ACE和Project G-Assist等AI技术,进一步增强了游戏体验。
  • 专业可视化:收入为4.54亿美元,同比增长20%,推出了用于OpenUSD的生成式AI模型,以加速工业数字孪生和机器人开发。
  • 汽车与机器人:汽车业务收入达到3.46亿美元,同比增长37%。NVIDIA还展示了Isaac机器人平台在全球领先企业中的应用。
股东回报与展望 NVIDIA在上半年通过股票回购和现金分红向股东返还了154亿美元。公司董事会批准了额外500亿美元的股票回购授权。本季度,NVIDIA的现金股息为每股0.01美元。此外,公司预计2025财年第三季度收入将达到325亿美元,并继续保持强劲的利润率。
新产品与技术NVIDIA推出了包括Blackwell系统和Spectrum-X以太网平台在内的多项新产品,并宣布与Hugging Face合作推出推理服务,加速生成式AI的应用。
大模型日报(8月29日 资讯篇)https://nvidianews.nvidia.com/news/nvidia-announces-financial-results-for-second-quarter-fiscal-2025
04

AI推理竞争白热化:Nvidia Blackwell、AMD、Google及新兴公司首秀MLPerf基准测试

近日,ML Commons发布了最新一轮的AI推理竞赛MLPerf Inference v4.1结果。此次比赛首次包含了Nvidia全新Blackwell芯片、AMD Instinct加速器、Google Trillium加速器以及初创公司UntetherAI的产品。尽管Nvidia在AI训练领域仍然占据主导地位,但在推理方面,其他公司尤其是在能效方面正在逐步赶上。
Nvidia的Blackwell芯片在大语言模型(LLM)问答任务中表现突出,其单个加速器性能较之前的版本提升了2.5倍。Blackwell成功的原因之一是其首次在MLPerf基准测试中展示了4位浮点精度运算,这大幅提高了计算速度。同时,Blackwell芯片的内存带宽几乎翻倍,达到8TB/s,相比前代H200的4.8TB/s有显著提升。此外,Blackwell支持多达18个NVLink连接,带宽总量达到1.8TB/s,进一步增强了其扩展能力。
Untether AI凭借其speedAI240 Preview芯片在能效方面表现尤为出色。该芯片采用“内存计算”架构,将处理器与内存单元直接相邻分布,大幅减少了数据传输所需的时间和能量消耗。在MLPerf的图像识别任务中,Untether AI的芯片在每瓦特查询次数上远超Nvidia的H200,展示了显著的能效优势。此外,该芯片在低功耗情况下的延迟性能也显著优于Nvidia的L40S。
虽然Cerebras和FuriosaAI未参与此次MLPerf竞赛,但两家公司分别在IEEE Hot Chips会议上推出了新的推理芯片。Cerebras的新服务CS3在LLM生成速度上自称超越Nvidia H100七倍。而FuriosaAI则展示了其第二代芯片RNGD,采用独特的张量收缩处理器(TCP)架构,在推理过程中更高效地利用张量的并行性和数据重用能力。
链接:https://spectrum.ieee.org/new-inference-chips
大模型日报(8月29日 资讯篇)https://mp.weixin.qq.com/s/cx-otFn6orFeEEZZqEt3kw
05

RL教父Sutton持续反向传播算法登Nature

这篇《Nature》发表的研究论文《Loss of plasticity in deep continual learning》探讨了深度学习在持续学习环境中的可塑性丧失问题。传统深度学习方法通常在训练阶段更新网络权重,而在使用或评估阶段则保持权重不变,这与许多需要持续学习的应用程序不符。研究发现,标准的深度学习方法在持续学习环境中逐渐失去可塑性,最终表现与浅层网络无异。通过实验,研究表明,只有通过持续向网络注入多样性的算法,才能维持可塑性。
研究提出了「持续反向传播算法」,这是反向传播的一种变体,旨在通过随机初始化部分神经元来维持网络的可塑性和学习能力。实验结果显示,常规的梯度下降方法不足以应对持续学习的需求,需要引入随机、非梯度的成分以保持可变性。研究使用经典的 ImageNet 数据集,通过设计一系列二元分类任务,展示了在持续学习中标准深度学习方法的性能下降问题。
该研究发现,一些流行的方法如 Adam、Dropout 和归一化实际上加剧了可塑性的丧失,而 L2 正则化在某些情况下可以减少这种损失。此外,持续反向传播通过选择性地重新初始化低效单元,并结合传统反向传播和随机性成分,有效地保持了网络的学习能力。研究还通过对 CIFAR-100 数据集进行类别增量学习的实验,验证了持续反向传播算法在多任务环境中的优势。最终,该方法在各类实验中表现出了优异的学习效果,为解决持续学习中的可塑性丧失问题提供了新的思路。
大模型日报(8月29日 资讯篇)https://mp.weixin.qq.com/s/jeqXj3ez5DbItS7RpoVaSg
06

陶哲轩IMO演讲全文

陶哲轩在IMO 2024演讲中,回顾了计算机和人工智能在数学研究中的应用历程,并展望了未来的发展。他强调,虽然AI在数学领域的作用日益显著,但人类的洞察力和创造力依然不可替代。演讲内容涵盖了从早期机械计算到现代AI辅助的演变过程。
他特别提到现代AI工具,如DeepMind的AlphaGeometry,以及形式化证明助手(如Lean)的发展。陶哲轩还分享了一些重要的数学突破,如四色定理和开普勒猜想的计算机辅助证明,展示了AI如何帮助处理复杂的数学问题。
然而,他也指出AI的局限性,目前的AI在数学研究中主要扮演辅助角色。尽管AI可以生成有价值的数学猜想,证明过程仍需要人类的介入。陶哲轩对未来充满期待,他认为随着AI技术的发展,将来有可能实现规模更大、更复杂的数学运算,开启数学研究的新篇章。
大模型日报(8月29日 资讯篇)https://mp.weixin.qq.com/s/GjJgHnl6tBBN1cRzDLXYag

推特

01

24小时内自动申请了1000份工作并获得了50次面试机会:LinkedIn_AIHawk,批量申请的同时保证质量

有人使用AI机器人在24小时内自动申请了1000份工作,并获得了50次面试机会!🤯
而且这个机器人的代码在GitHub上是开源的。👨🔧
这个工具可以自动化你的LinkedIn求职和申请流程。
  • 扫描符合你条件的职位空缺,
  • 使用LinkedIn的“Easy Apply”功能进行职位申请,
  • 生成定制的简历,
  • 使用大语言模型(LLM)个性化回应雇主问题,
  • 可以批量申请,同时保持质量控制,
  • 安全管理你的数据,并与OpenAI的API集成,提供AI驱动的功能。
大模型日报(8月29日 资讯篇)https://x.com/rohanpaul_ai/status/1828598009673683347
02

利用Gemini进行大型多模态模型提示

探索我们全新短课程《利用Gemini进行大型多模态模型提示》,由Erwin Huizenga与@googlecloud合作授课,了解最先进的多模态提示技术。
本课程中的一个有趣见解是:在多模态模型中,提示结构至关重要。例如,在输入文本信息(如患者的病史)之前输入图像(如X光片),可以增强模型对视觉数据的上下文理解和解释能力。在其他场景下,例如图像描述,先放置图像可能会产生更好的效果。多模态模型的行为与纯文本大语言模型不同,有效的提示方式取决于您使用的模型类型。在本课程中,您将学习如何有效地为Gemini模型进行提示。
Gemini的多模态功能还使AI应用开发有了新的方法,例如:
  • Gemini库支持各种视频格式(MP4、MOV、MPEG),简化了这些格式的应用程序开发。
  • 大上下文窗口(可达100万个token)使得处理大量内容成为可能,例如同时分析多个50分钟的视频。
  • 函数调用功能将实时数据(如当前汇率)集成到模型的响应中。
本课程通过实际案例展示了如何构建多模态应用,包括能够同时分析文本和图表的文档分析器、从多个小时的视频中提取并标记特定信息的视频内容提取器、以及自动化处理收据图像并核对公司政策的费用报告系统。

大模型日报(8月29日 资讯篇)https://x.com/AndrewYNg/status/1828844538712224137

03

发布TB-OCR-preview:端到端OCR模型,能够同时处理文本、数学LaTeX和Markdown格式

发布TB-OCR-preview:一个端到端OCR模型,能够同时处理文本、数学LaTeX和Markdown格式。它可能是学术论文OCR的最新顶尖模型(MIT许可证下发布)。
运行该模型仅需4-bit,约需~2.8GB的VRAM,且几乎没有性能下降。
  • 针对学术论文的内部基准测试结果:WER = 0.04,MER = 0.04,CER = 0.01
  • 模型以一段文本作为输入,返回干净的Markdown输出。
  • 标题以##标记。
  • 数学表达式保证被括号(…) […]包裹,便于解析。
  • 该模型不需要行检测或数学公式检测。
这是一个预览模型,用于验证从合成数据管道生成的数据集的质量。预览模型仅使用了~25万对图文配对数据(约5000万tokens)。
当前模型基于Phi-3.5-vision。性能更强的小型模型目前正在训练或测试中。
HF模型页面:https://huggingface.co/yifeihu/TB-OCR-preview-0.1
大模型日报(8月29日 资讯篇)https://x.com/hu_yifei/status/1828870309857915341
04

Cartesia AI:我们的团队率先开发了一种极为高效的AI架构——状态空间模型

今天,我们揭开了迈向普及人工智能旅程中的一个重要里程碑:**AI On-Device**。
我们的团队率先开发了一种极为高效的AI架构——状态空间模型(SSMs)。现在,我们已经在边缘设备上进行了优化和部署。我们相信,AI的未来将在您的设备上运行,这样它可以持续处理,同时保证可靠性、隐私性和安全性。
阅读我们的完整博客文章:http://cartesia.ai/blog/on-device
大模型日报(8月29日 资讯篇)https://x.com/cartesia_ai/status/1828500784033735156

产品

01

GoMarble

GoMarble 的 AI 广告分析工具可以快速分析视频和静态广告,帮助用户识别有效元素和不足之处。用户上传广告后,系统会生成详细报告,适用于数字营销人员和创意策略师。
大模型日报(8月29日 资讯篇)https://adsanalyzer.gomarble.ai/
02

GPTEngineer

gptengineer.app 是一个快速原型设计工具,允许用户通过自然语言创建网页应用。它支持实时迭代、与 GitHub 的双向同步,并能一键部署到生产环境,旨在帮助开发者更高效地构建和发布应用。
大模型日报(8月29日 资讯篇)https://gptengineer.app/
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

  3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/08/13246.html

Like (0)
Previous 2024-08-29 19:23
Next 2024-08-30 15:18

相关推荐

  • 大模型日报(9月7~8日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-09-08
    298
  • 揭秘DriveLM:首个含图结构“语言+自动驾驶”全栈数据集

               1.首个含图结构的“语言+自动驾驶”全栈数据集               与传统自动驾驶领域数据集相比,DriveLM的突出特征在于,它是一个主要针对图像,…

    2024-05-28
    390
  • 大模型日报(9月5日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-09-05
    293
  • 大模型日报(4月16日 资讯篇)

    欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 第一个超越GPT-4的开源模型!Wizard…

    2024-04-16
    123
  • 大模型日报(4月4、5、6日)清明节特刊

    欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 震惊!爆火推特7万点赞:由AI生成的弹钢琴的…

    2024-04-06
    198
  • 出门问问李志飞:大模型下半场,要找到自己的灵魂|Z Circle

    Z Circle是关于人的栏目。 人是一切创新的源动力。在过去的十二年里,真格一直专注投人,连接起最真挚、勇敢、极具创新精神的人们。我们记录他们的故事和旅程,希望与你相识,也期待你…

    2023-09-27
    371
  • 大模型日报(9月13日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-09-13
    306
  • 大模型日报(4月25日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-04-25
    173
  • 大模型日报(4月7日 资讯篇)

    欢迎观看大模型日报,如需进入大模型日报群和空间站请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 斯坦福大学24Spring再次开设Trans…

    2024-04-07
    133
  • 大模型日报(8月16日 资讯篇)

    特别活动! 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.f…

    2024-08-16
    241