大模型日报(9月4日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(9月4日 资讯篇)

资讯

01

微软正尝试在Office中集成国产开源大模型RWKV

微软正在尝试在Office中集成国产开源大模型RWKV。RWKV官方推文指出,RWKV.cpp已部署在全球五亿系统中。用户在最新Windows 11的Office文件夹中发现以RWKV命名的DLL文件,反编译后确认其为RWKV.cpp的变体。网友对此议论纷纷,呼吁微软提供支持和报酬。
RWKV团队推测微软可能将其用于本地Copilot和memory recall功能。RWKV的优势包括支持100多种语言、低能耗,适合在不同设备上运行。RWKV模型在生成更多token时的计算资源需求呈线性增加,GPU能耗更为高效,适用于延长设备电池寿命。
RWKV是一种挑战Transformer的新架构,基于RNN设计,复杂度更低,生成内容速度快,且显存占用恒定。RWKV背后团队来自多家机构,由30位研究人员组成。RWKV近期推出新架构模型RWKV-5和RWKV-6,进一步提升了模型的表达能力,并引入了一个1.12万亿token的多语言语料库,强化了多语言支持。
大模型日报(9月4日 资讯篇)https://mp.weixin.qq.com/s/x0HoJpsW3Wci3lI7TZU1YQ
02

英特尔(®) 酷睿(™) Ultra 200V系列处理器

英特尔刚刚发布了其最新的酷睿™ Ultra 200V系列处理器,标志着x86架构处理器效率的新高度。该系列处理器带来了多个关键亮点:
  1. 更快的处理器性能:E核性能提升68%,P核提升14%。
  2. 全新图形微架构Xe2:集成GPU性能提升30%,游戏性能提升31%,并支持光线追踪。
  3. 强大的AI性能:CPU、NPU和GPU总算力达120TOPS,提升AI处理能力,尤其在Adobe应用中的表现优于竞争对手。
  4. 超高效率:整体功耗降低50%,单线程处理性能提高3倍,续航可达20小时。
  5. 广泛的兼容性:支持各种软件应用,且超越AMD和高通在性能和电池寿命方面的表现。
Ultra 200V系列通过创新的低功耗设计及集成管理技术,如Thread Director,优化了效率。此外,英特尔与多家顶级OEM厂商(如谷歌、微软、联想、戴尔、惠普等)合作,推出了超过80款搭载该处理器的机型,进一步扩大了AI PC的市场影响力。
大模型日报(9月4日 资讯篇)https://mp.weixin.qq.com/s/XQ0C0sKrHNx4uCcBpTAYAw
03

英伟达市值暴跌2万亿

英伟达在一夜之间市值蒸发2790亿美元,创下美股历史上单日最大跌幅,暴跌9.5%。这一跌幅甚至超过了Meta在2022年创下的纪录,显示了市场对AI产业前景的担忧。投资者对AI的过高预期未能实现,尤其在英伟达公布财报后,尽管营收和利润大幅增长,但股价未能维持上涨。市场对AI的泡沫逐渐冷却,部分分析师认为,AI投资目前回报有限,未出现真正的杀手级应用。
与此同时,美国司法部升级了对英伟达的反垄断调查,已向公司发出传票,调查其是否通过市场垄断限制客户选择。英伟达被怀疑通过优先供应和定价策略,迫使客户依赖其AI芯片,并且利用其在AI芯片市场的主导地位压制竞争。英伟达对此回应称,其市场地位源于产品质量和客户价值。
大模型日报(9月4日 资讯篇)https://mp.weixin.qq.com/s/W79P_SL3HZirso42c-VgDw
04

LeCun转帖,AI精确计算宇宙「设置」,登Nature子刊

Meta首席人工智能科学家Yann LeCun在X平台上转发了纽约大学物理系教授Shirley Ho的帖子,展示了SimBIG团队的一项新研究。由Changhoon Hahn领导的团队通过AI模拟宇宙,模拟了20,000个虚拟宇宙并产生了新的见解。这项研究利用AI根据光谱望远镜(如Sdssurveys)的数据,训练AI从观测到的宇宙统计中推断出关键的宇宙学参数。该论文于2024年8月21日发表在《Nature Astronomy》上,题为「Cosmological constraints from non-Gaussian and nonlinear galaxy clustering using the SimBIG inference framework」。
研究的核心是通过AI和深度生成模型,结合非高斯信息,增强宇宙学推断的精度。研究团队分析了BOSS星系巡天的部分数据,通过AI模型获取了比传统方法更严格的参数估计结果,尤其是在哈勃常数和S8参数上的推断,精确度分别提高了1.5倍和1.9倍。这些结果对理解暗物质、暗能量以及宇宙加速膨胀至关重要。
大模型日报(9月4日 资讯篇)https://mp.weixin.qq.com/s/SE9Uo88kvSqD2YLM57i-hg
05

神经网络准确计算量子激发态

在物理和化学领域,激发态的精确计算至关重要,但通过第一性原理进行可扩展、准确且稳健的激发态计算一直是理论挑战。本文提出了一种无参数的新算法,通过将变分量子蒙特卡洛(VMC)方法推广到神经网络计算的基态,来解决这一问题。
Pfau等人提出了一种称为“自然激发态VMC”(NES-VMC)的方法,将激发态问题转化为扩展系统的基态问题,并使用神经网络(如FermiNet和Psiformer)进行计算。该方法无需正交化处理,且不含自由参数,可以高效计算不同量子系统的激发态,包括过渡偶极矩等任意观测量。
该方法在多个原子和分子系统上展示了准确的激发态计算性能,尤其在苯规模的分子系统中表现出色,解决了多个具有挑战性的双重激发问题。在乙烯分子的锥形交叉问题中,NES-VMC的计算结果与多参考配置相互作用(MR-CI)高度一致。对于更复杂的分子(如苯和四嗪),NES-VMC的结果也优于现有的神经网络和其他先进方法。
NES-VMC结合神经网络提供了一种无参数且数学上严格的激发态变分原理,展现出对量子系统激发态进行精确计算的潜力,适用于电子激发、振动耦合等问题,并对分子、核物理等领域的研究具有广泛应用前景。
大模型日报(9月4日 资讯篇)https://www.science.org/doi/abs/10.1126/science.adn0137
06

MIT开发新工具帮助甄选合适的训练数据集

为了训练更强大的大型语言模型(LLM),研究人员依赖于来自网络的海量数据集,但这些数据集的来源信息和使用限制常常在组合和重新组合中被忽略或混淆。这不仅带来法律和伦理问题,还可能影响模型性能。例如,错误分类的数据集可能导致不适合任务的数据被使用,数据中的偏见还可能导致不公平的预测。
MIT 和其他机构的研究团队审计了 1800 多个常见数据集,发现超过 70% 的数据集缺乏许可信息,约 50% 含有错误信息。基于此,他们开发了“数据来源探索器”工具,帮助自动生成数据集的来源、许可等信息,旨在提升 AI 模型的透明性和性能。
研究表明,透明的数据来源对模型的可靠性至关重要,尤其是涉及特定任务的微调数据集。在众包平台上,数据集的原始许可信息常被忽视,可能导致开发者因数据集许可问题而被迫下架模型。研究团队通过系统审计和反向追溯,减少了“未指明”许可数据集的比例。
此外,研究指出,大多数数据集由全球北部的研究人员创建,可能在其他地区表现不佳。为了进一步提升数据集的透明性,研究人员正在扩展其分析范围,涵盖多模态数据和数据来源网站的服务条款,推动负责任的 AI 发展。
大模型日报(9月4日 资讯篇)https://mp.weixin.qq.com/s/qTYIQLkVVA-FHJXzX2DvYQ

推特

01

Project Sid:首个在虚拟世界中模拟1000多个真正自主代理协作的项目

介绍 Project Sid:这是首个在虚拟世界中模拟1000多个真正自主代理协作的项目,涵盖了自发的经济、文化、宗教和政府。
人类是唯一登上月球的物种,因为我们能够进行大规模合作。
人工智能能做到同样的事情吗?

大模型日报(9月4日 资讯篇)https://x.com/GuangyuRobert/status/1831006762184646829

02

Anthropic Quickstarts 仓库推出:帮助开发者快速使用 Anthropic API 构建可部署应用程序的项目集合

宣布推出 Anthropic Quickstarts 仓库,这是一个旨在帮助开发者快速使用 Anthropic API 构建可部署应用程序的项目集合。
首个快速入门项目:一个由 Claude 驱动的客户支持代理应用。

大模型日报(9月4日 资讯篇)https://x.com/alexalbert__/status/1831022348784542090

03

使用 Cursor + Magic UI快速生成美观登陆页面

需要一个美观的登陆页面吗?
使用 Cursor + Magic UI。
只需一行代码安装组件,并通过 Cursor Composer 标记它们,让 AI 为你完成全部工作。
看看我的工作流程——就是这么简单。

大模型日报(9月4日 资讯篇)https://x.com/mckaywrigley/status/1831098800351719924

04

Schizo分享创业项目:为互联网的 AI 内容打标签

我很高兴宣布作为联合创始人推出我的首个创业项目。
我们为互联网的 AI 内容打标签。
凭借我们的专业知识和开发的技术,我们致力于成为首家能够比 AI 内容生成速度更快地可靠打标签的公司。我们还将能够检测 AI 机器人及更多功能。
这对于大型社交媒体和像 Discord 这样的庞大社区将特别有用。
我们正在寻找风投,同时也可能考虑聘请一位能够管理公司的专业 CEO,因为我们只专注于研究。
大模型日报(9月4日 资讯篇)https://x.com/BLUECOW009/status/1831051860750590045
05

/llms.txt:可以用来告诉模型在哪里可以找到适合 LLM 的网站内容

今天  @answerdotai  提出了 /llms.txt。这是一个文件,您可以用来告诉模型在哪里可以找到适合 LLM 的网站内容。
它提供了背景信息,并附有链接,指向提供更多详细信息的 markdown 文件。
大模型日报(9月4日 资讯篇)https://x.com/jeremyphoward/status/1831089138571133290

产品

01

Jamboss

Jamboss 是一款简单易用的 AI 音乐生成应用,允许用户免费生成 20 首歌曲,通过提供提示词或歌词,并选择风格来创作。该应用希望可以让更多人享受音乐创作的乐趣,目前仅在 iOS 上可用。
大模型日报(9月4日 资讯篇)https://www.jamboss.com/
02

Spellar

Spellar 是一款 AI 驱动的会议助手,可以帮助提升会议效率,支持实时智能帮助、自动生成会议摘要和多语言功能,也可以实现多平台集合。
大模型日报(9月4日 资讯篇)https://spellar.ai/

投融资

01

 原绘一科技CTO任文峰创业,布局AI Agent

据悉,创始人任文峰曾任绘一科技联合创始人兼CTO,并荣获2022年胡润U30创业领袖称号,公司成员还包括前美国科技公司的高级工程师、985高校博士等。
据公开资料显示,「硅基万物」专注于构建智能体(AIAgent)应用。
据悉,「硅基万物」目前已完成数百万种子轮融资。
大模型日报(9月4日 资讯篇)
推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

  3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/09/13130.html

Like (0)
Previous 2024-09-04 19:12
Next 2024-09-05 17:42

相关推荐

  • Beidi Chen陈贝迪 独家 | 高效长序列生成之路:CPU & GPU —— 算法、系统与硬件的 co-design

    本期我们邀请到了 纽约大学计算机科学院博士 童晟邦 带来【多模态大模型:视觉为中心的探索】的主题分享。 上期我们有幸邀请到了陈贝迪教授带来【长序列文本生成】的主题分享,以下为分享的…

    2024-08-20
    281
  • 大模型日报(4月20~21日 资讯篇)

    欢迎观看大模型日报,进入大模型日报群和空间站(活动录屏复盘聚集地)请直接扫码。社群内除日报外还会第一时间分享大模型活动。 欢迎大家一起交流! 推特 01 Zuck在Dwarkesh…

    2024-04-21
    178
  • 大模型日报(8月24~25日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-25
    210
  • 大模型日报(9月12日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-09-12
    316
  • 大模型日报(6月19日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。 欢迎大家一起交流! 资讯 0…

    2024-06-19
    213
  • BEV常见的开源算法系列二 | BEV下的多模态融合

    BEV感知系列分享是整数智能推出的一个全新分享系列,在这个系列中,我们将介绍BEV感知相关的算法和数据集等内容。BEV感知系列主要分为以下几篇文章: BEV感知,是下一代自动驾驶感…

    2022-11-21
    244
  • 大模型日报(9月9日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-09-09
    287
  • 大模型日报(8月9日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-08-09
    212
  • 大模型日报(7月24日 资讯篇)

    我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.…

    2024-07-24
    217
  • 火爆CV圈的SAM是什么?

    01 SAM是什么 前言 最近几周,人工智能的圈子里都在讨论SAM(Segment Anything Model),一个号称(零样本)分割一切的图像分割模型。 图:Segment …

    2023-05-19
    129