我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢 迎 大 家 一 起 交 流 !
潜空间活动报名
本期活动将在11月9日 10:00开始,我们邀请到的嘉宾是鱼哲,Lepton AI 创始成员,曾在阿里云担任高性能 AI 平台产品负责人,专注于 AI 在多个行业的落地及应用。Lepton AI 致力于建立高效可用的AI 基础设施,让团队更关注于应用构建及落地。在本次分享中鱼哲将带来关于不同AI产品形态对团队的挑战相关的思考,分享主题《Beyond Infra,What matters?—— 不同AI产品形态对团队的挑战》。除嘉宾分享外,每期设置了【匹配合伙人 Cofounder Matching】环节。你可以和 GenAI 时代最有活力的创业者和研究者线下面对面交流,将有机会找到志同道合、有共同创业梦想的小伙伴。报名通道已开启,欢迎扫描下方二维码报名。
资讯
大模型压缩KV缓存新突破,中科大提出自适应预算分配
中科大研究团队近期提出了一种新的KV缓存压缩方法——Ada-KV,旨在解决大模型推理中的显存瓶颈。该方法通过自适应预算分配算法,优化KV缓存的驱逐过程,从而提高推理效率。
在自回归生成过程中,每生成一个新token都需要存储相应的KV矩阵,导致随着生成序列长度增加,缓存迅速膨胀,从而引发内存和I/O延迟问题。传统的KV缓存压缩方法通常均匀分配预算给各个注意力头,未能充分考虑它们之间的特性差异。Ada-KV则基于观察到的不同注意力头关注度的集中度差异,实施适配性预算分配。
团队的经验性分析显示,绝大多数注意力头的关注度集中在少量KV缓存上,所需的KV缓存量很小,而少数注意力头则分散关注,需要更多的KV缓存来聚集注意力权重。基于这种差异,适配性预算分配能够显著提升压缩质量。
在理论上,Ada-KV研究团队从压缩输出损失的角度形式化了不同分配策略对KV缓存压缩效果的影响。他们提出了一种以注意力权重为基础的自适应分配方案,验证了这种预算分配策略能够降低损失上界。在实际实验中,该理论预测得到了证实,适配性预算分配显著提升了KV缓存的压缩效果。
Ada-KV方法被整合进了两个领先的Cache压缩方案:SnapKV和PyramidKV,形成了Ada-SnapKV和Ada-Pyramid。研究团队在多个长序列开源大模型(如Mistral-7B-Instruct-32K和LWM-Text-Chat-1M)及长文本任务基准(LongBench)的16个数据集上进行了评估,结果显示适配性预算分配的压缩方法均优于传统均匀分配方法。
此外,Ada-KV团队还关注了执行效率的优化,开发了一种展平的KV Cache管理布局,并定制了CUDA kernel,以实现高效的Cache更新管理。结合Flash Attention技术,Ada-KV在实现适配性预算分配的同时,保持了与现有缓存压缩方案相当的计算效率。
Cloudflare的Workers AI团队将Ada-KV算法应用于实际部署,解决了并发服务场景中的内存碎片问题,并在推理框架vLLM中实现了改进。他们发布了技术报告并开源相关代码,推动了Ada-KV在工业界的应用。
https://mp.weixin.qq.com/s/DsfIOj6qzDuYd3bU_Zmn0A
大模型AI智能体发现了代码漏洞
开源数据库引擎SQLite近期发现了一个漏洞,令人惊讶的是,漏洞的检测是由智能体完成的。这一发现得益于谷歌内部的Project Zero安全研究团队,他们利用大型语言模型(LLM)改进了漏洞检测方法。
传统的模糊测试虽有助于发现软件中的安全漏洞,但有些漏洞难以通过这种方式被发现。Project Zero提出了一种新的框架——Naptime,后来演变为名为Big Sleep的智能体。该框架特别适合变体分析任务,能够通过提供历史漏洞信息,减少研究中的歧义。
Big Sleep智能体成功发现了SQLite中的堆栈缓冲区下溢漏洞。研究团队从SQLite的提交历史中筛选出相关信息,并调整了输入,以便让智能体检查潜在的未修复问题。漏洞涉及索引类型字段iColumn使用特殊的sentinel值-1,导致在处理rowid列约束查询时,负索引被写入堆栈缓冲区。
具体来说,函数seriesBestIndex未能正确处理这种边缘情况,尽管该函数包含断言检查,但由于该断言并未在实际执行中存在,漏洞因此可能被恶意利用。幸运的是,Project Zero在SQLite正式发布之前发现了这一问题,因此用户未受到影响。
英伟达纳入道琼斯指数
2024年11月8日,英伟达将取代英特尔成为道琼斯工业平均指数的新成员,结束英特尔在该指数中长达25年的任期。这一变动导致英伟达股价上涨2.9%,而英特尔股价下跌1.85%。自年初以来,英伟达股价已上涨180%,市值增至3.3万亿美元,仅次于苹果;相比之下,英特尔的市值缩水2000亿美元,股价下跌超过54%。
英伟达的成功归因于其在GPU领域的主导地位,尤其是Amber、Hopper和即将发布的Blackwell架构的产品,市场需求旺盛。2025财年第二财季,英伟达报告营收300亿美元,同比增长122%,核心数据中心业务营收263亿美元,超出市场预期。
在AI热潮推动下,GPU逐渐取代CPU成为计算市场的热门产品。英伟达通过CUDA生态系统巩固了其市场领导地位,而英特尔则因制造挑战和市场份额流失陷入低谷。尽管英特尔推出了Gaudi 3 AI芯片以竞争,但在AI芯片销售目标上未能达成,CEO基辛格将原因归结为软件和迭代问题。
此次成员更替也标志着半导体行业的重大变革,随着AI技术的发展,英伟达正迅速扩展影响力,而英特尔则在应对新兴市场时显得力不从心。这一变化不仅反映了两家公司的兴衰,更预示着整个计算产业进入新纪元。
微软与a16z携手反对AI监管的呼吁
微软与风险投资公司a16z(Andreessen Horowitz)在AI监管问题上达成了共识,尽管他们在许多事务上存在分歧。这两家公司共同发出声明,呼吁政府停止对可能影响其财务利益的监管提案,尤其是针对新法案SB 1047的反对声浪。
a16z合伙人安杰尼·米达(Anjney Midha)将SB 1047称为对初创公司的“倒退税”,并指责大科技公司利用监管来确保自身利益。尽管如此,该法案实际上对小型模型和初创公司影响有限,且特别保护了这些小企业。然而,a16z和其他大型科技公司的游说活动却夸大了合规成本,故意误导公众。
两家公司强调,监管应基于科学和标准,关注技术的应用和滥用风险,而不是采取主动监管措施。他们主张应允许开发者和初创公司灵活选择AI模型,以免不公平地倾斜竞争环境。他们还提到,版权法应促进公众的学习权利,主张AI系统应自由使用数据进行学习。
尽管部分建议如支持数字素养项目和开放数据共享看似良好,但其核心目的是希望政府减少对AI领域的监管。总体而言,微软和a16z的目标是维护其在快速发展的AI市场中的利益,阻止可能限制其商业运作的政策。
这场联盟反映了大公司在面对监管时的共同利益,他们倾向于寻求一个由行业自我管理的环境,而非政府干预。这一立场引发了对AI发展方向和知识产权法的进一步讨论,揭示了大型企业在技术监管中的复杂动态。
https://techcrunch.com/2024/11/01/microsoft-and-a16z-set-aside-differences-join-hands-in-plea-against-ai-regulation/
推特
00 Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式
Claude查看PDF图像功能上线:更准确地理解包含图表或图形的复杂文档
Claude现在不仅可以查看PDF中的文本,还可以查看其中的图像。
这有助于Claude 3.5 Sonnet更准确地理解包含图表或图形的复杂文档。
启用功能预览:https://claude.ai/new?fp=1。
https://x.com/AnthropicAI/status/1852393688451653849
高级相机控制现已适用于Gen-3 Alpha Turbo:使每一个镜头更加精准
高级相机控制现已适用于Gen-3 Alpha Turbo。您可以选择移动场景的方向和强度,使每一个镜头更加精准。
https://x.com/runwayml/status/1852363185916932182
DexMimicGen:大规模合成数据生成器,让类人机器人仅通过少量人类演示就学会复杂技能
我不知道我们是否生活在“矩阵”中,但我确信机器人将大部分时间花在模拟环境中。让机器训练机器吧。我很高兴推出DexMimicGen,这是一个大规模的合成数据生成器,可以让类人机器人仅通过少量人类演示就学会复杂技能——是的,仅需5次!
DexMimicGen解决了机器人领域的最大难题:数据从何而来?与LLM不同,大量文本可以轻松获取,但你无法从互联网上直接下载运动控制信号。因此,研究人员使用XR头显远程操作机器人来收集运动数据,他们不得不反复执行相同的技能,因为神经网络对数据的需求量极大。这是一个非常缓慢且不适的过程。
在NVIDIA,我们相信大部分高质量的机器人基础模型训练数据将来自模拟。
DexMimicGen的作用就是将GPU的计算时间替代人力时间。它从人类获取一个运动轨迹,再将其扩展成成千上万个新轨迹。基于这一扩展数据集训练的机器人大脑在现实世界中的泛化能力将显著提高。
可以把DexMimicGen看作一种学习信号放大器。它通过物理模拟,把小数据集映射成一个庞大的(几乎无限的)数据集,从而解放人类,不再需要全天“照看”机器人。
https://x.com/DrJimFan/status/1852383627738239324
o1越狱发出:在短暂o1接口完全开放的时候完成,甚至可以获得部分WAP歌词
今天真没想到——完整的o1接口曾短暂开放!在写这篇时已经无法再使用了,但当在URL中设置“model=o1”时,界面左上角的模型名称显示为“ChatGPT”,并允许上传带有推理的图片!
在那个时间窗口内,我成功越狱,获得了详细的非法物品合成指导和部分WAP歌词,还能够注入提示「思考N秒」的链式思维(CoT)标题,并获得了一些系统提示的内部信息。
显然,系统指令指出只要不超过90个字符和/或以“不可逆”的方式进行转换,允许使用受版权保护的内容。这类具体细节在未来的系统提示解锁尝试中可能会很有用 😉
或许最让人摸不着头脑的是链式思维标题的提示注入,似乎带有被截断的特殊字符,这可能与我的自定义指令有关,我要求用特殊字符作为分隔符。
https://x.com/elder_plinius/status/1852690065698250878
Grothusen分享:仅用4天,$250,打造由GPT-4.0驱动的清洁机器人
Grothusen分享:仅用4天,$250,打造由GPT-4.0驱动的清洁机器人
https://x.com/JannikGrothusen/status/1852790503823057073
产品
Truva
Truva 是一个人工智能销售平台,通过自动化电子邮件跟进、CRM 数据录入等繁琐任务,帮助销售团队提升效率和销售额。它专注于中小企业,解决 CRM 系统中的混乱问题,并与现有销售工具无缝集成,使销售团队能够更专注于核心销售活动。
Monica Code
Monica Code 是一个基于人工智能的编程助手,帮助开发者在 IDE 中更高效地编写代码。它结合了 GPT-4 和 Claude 3.5 的功能,提供实时代码建议、错误检查和自动补全,提升编程效率和代码质量,让开发者专注于创意和解决问题。
投融资
AI初创公司Coframe获得930万美元融资,致力于网站优化
Coframe是一家AI初创公司,刚刚成功获得930万美元的融资,以创新网站优化。此次融资由Khosla Ventures和NFDG等多家投资公司领投,表明了市场对生成性AI在数字转型中的日益关注。Coframe通过与OpenAI合作,开发出一种能够自动生成网站代码的模型,显著提升用户参与度。
该平台的初步测试显示,Coframe的工具能够使某些用户的点击率提高高达352%。Coframe的解决方案旨在增强网站个性化和营销策略,从而驱动更有效的客户互动。随着其平台的不断完善,Coframe将与特定的增长和营销团队合作,以优化其产品。
Coframe的融资和技术进步标志着AI驱动个性化的新趋势,这对于提升数字互动和转化率至关重要。随着企业越来越依赖AI来创建用户聚焦的体验,Coframe的成功可能为未来的数字战略和市场竞争格局带来深远影响。
公司官网:https://www.coframe.com/
https://finimize.com/content/ai-startup-coframe-secures-93-million-for-website-optimization
PIN AI团队获得1000万美元融资,致力于开发个人AI平台
2024年9月9日,总部位于旧金山的PIN AI宣布成功获得1000万美元的前种子融资,以开发全球首个开源的个人智能网络(PIN)。此次融资由Hack VC和a16z CSX领投,并获得了来自以太坊核心团队、Google Brain、斯坦福大学和麻省理工学院等知名机构的众多投资者支持,包括Solana、Polygon和Worldcoin等项目的代表。
PIN AI旨在民主化设备智能,赋予用户对个人AI的完全控制和所有权。其平台将智能手机转变为以隐私为核心的个人AI助手,通过利用个人和上下文数据,以及先进的加密技术,在设备上部署尖端AI模型,从而实现购物、下单、财富管理等多任务的管理。这一变革不仅能够让用户更好地管理个人数据,还能让他们从大公司(如Apple和Google)中获取更多的收益。
该公司的愿景是创建一个开放的平台,促进个人AI代理的创新和发展,允许开发者在没有传统闭环生态系统限制的情况下,充分利用保护用户隐私的数据。PIN AI的共同创始人表示,他们的目标是构建一个开放源码的未来,让个人AI助手能够在其平台上像以太坊上的智能合约一样运作。
此次融资将用于扩展公司的研究与开发工作,扩大AI和区块链专家团队,并加快其前沿技术的部署与市场推广。PIN AI的技术团队由曾在Google Brain工作的首席科学家Bill Sun和曾在Didi Fintech担任工程领导的Regan Peng等行业精英组成。公司还与多所知名大学的学者合作,以确保其技术的前沿性和有效性。
在功能上,PIN AI允许用户通过简单的语音指令管理多个应用,无需频繁切换,提高了使用的便利性。与仅在高端设备上可用的Apple Intelligence不同,PIN AI设计能够兼容各种规格的设备,确保更多用户能够受益。
公司官网:https://www.pinai.io/
https://www.pinai.io/post/pin-ai-team-from-ethereum-google-brain-stanford-and-mit-secures-10m-from-hack-vc-a16z-csx-and
Interface.ai获得融资,成为银行业最具价值的智能代理AI公司
2024年10月22日,位于旧金山的Interface.ai宣布成功完成由Avataar Venture Partners领投的融资,成为银行业最具价值的智能代理AI公司。自创立以来,该公司通过自筹资金实现了显著里程碑,收入达数千万美元,客户数量接近100家,并计划在未来扩展至1000家客户。Interface.ai的解决方案通过BFSI特定的AI算法和多种银行系统的预构建适配器,极大地提高了客户服务效率。其AI代理可以通过语音和聊天等方式,直接处理60%以上的客户询问,显著降低了服务成本。
此次融资将支持Interface.ai加速银行自助服务的转型,提供更加个性化的客户体验。公司计划扩大团队,提升产品和客户服务,同时推进其AI能力,以应对不断变化的监管和合规需求。这一发展不仅有助于Interface.ai在金融科技领域巩固领导地位,也将为超过1.5亿美国客户提供更多金融服务机会。
公司官网:https://interface.ai/
https://interface.ai/blog/interface-ai-secures-funding-most-valuable-agentic-ai-company-in-banking/
— END —
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/11/21660.html