大模型日报(10月9日 资讯篇)

我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区:

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。

大模型日报(10月9日 资讯篇)

资讯

01

David Baker、Alphafold开发者获2024年诺贝尔化学奖

2024 年诺贝尔化学奖与蛋白质有关,这些生命中巧妙的化学工具。David Baker 成功完成了几乎不可能的任务——构建全新的蛋白质类型。Demis Hassabis 和 John M. Jumper 则开发了一种 AI 模型来解决一个长达 50 年的难题:预测蛋白质的复杂结构。这些发现具有巨大的潜力。
生命的多样性证明了蛋白质作为化学工具的惊人能力。它们控制并驱动所有化学反应,这些化学反应共同构成了生命的基础。蛋白质还作为激素、信号物质、抗体和不同组织的构成单元发挥作用。
“今年被认可的一个发现涉及壮观蛋白质的构建。另一个则是实现了 50 年的梦想:从氨基酸序列预测蛋白质结构。
这两个发现都开启了广阔的可能。”诺贝尔化学委员会主席 Heiner Linke 说。

大模型日报(10月9日 资讯篇)

https://mp.weixin.qq.com/s/mXCRAZLxfRpYRIh4BFuqrA

02

Fei-Fei Li选择Google Cloud作为World Labs的主要计算提供商

在全球云服务市场争相与AI初创企业合作的背景下,Fei-Fei Li领导的World Labs选择Google Cloud作为其主要的计算提供商,用于训练AI模型。尽管Li曾担任Google Cloud的AI首席科学家,双方表示这一合作并非基于其过往关系,而是出于技术考虑。该交易可能价值数亿美元。
在2024年10月的Google Cloud Startup峰会上,World Labs宣布将使用其大部分资金来租赁Google Cloud的GPU服务器,以训练“空间智能”AI模型。这类多模态AI模型需处理视频和地理空间数据,具有高计算需求。World Labs最近获得了由A16Z领投的2.3亿美元融资,估值超过10亿美元。
尽管AI领域的其他公司如OpenAI和Anthropic分别选择了Microsoft Azure和AWS进行合作,World Labs此次选择了Google Cloud的GPU平台。虽然Google提供自研TPU芯片作为替代方案,但由于行业对Nvidia GPU的偏好,World Labs目前仍决定使用GPU。
Google Cloud的高性能工具包和丰富的AI芯片资源成为这次合作的重要因素,尽管双方未透露World Labs GPU集群的具体规模。Google Cloud正尝试吸引更多初创企业使用其TPU,以减少对Nvidia GPU的依赖。
此合作并不具排他性,意味着World Labs仍可能与其他云服务商合作。但Google Cloud目前承载了World Labs的大部分计算任务,并计划维持这一业务。

大模型日报(10月9日 资讯篇)

https://techcrunch.com/2024/10/08/fei-fei-li-picks-google-cloud-where-she-led-ai-as-world-labs-main-compute-provider/
03

OpenAI在新加坡、巴黎和布鲁塞尔开设新办公室推动全球扩张

OpenAI宣布将在纽约、巴黎、布鲁塞尔和新加坡等城市开设新办公室,以推动其全球扩展计划。这次扩展是在该公司完成64亿美元融资、宣布重组计划和高管离职后展开的。除了旧金山、伦敦、都柏林和东京的现有办公室外,OpenAI此次扩张进一步巩固其全球布局。
前Dropbox亚太及拉美业务负责人、Asana前首席营收官Oliver Jay将从新加坡领导公司的国际运营,并负责全球扩张。OpenAI在新加坡的团队已开始组建,计划今年年底前正式启动新加坡办公室。新加坡将作为公司在亚太地区的运营中心,为客户和合作伙伴提供支持。这将是OpenAI在亚洲的第二个办公室,此前已于4月在东京开设了首个办公室。
OpenAI指出,新加坡是全球人均ChatGPT用户量最高的国家之一,自年初以来,新加坡的每周活跃用户数量已翻倍。OpenAI还与AI新加坡达成合作,旨在扩大其AI技术在东南亚地区的应用。AI新加坡是新加坡国家研究基金会于2017年发起的国家级项目,支持本地企业和研究机构在人工智能领域的发展。
OpenAI CEO Sam Altman表示,随着新加坡在技术领域的领导地位日益凸显,人工智能已被视为解决社会难题并促进经济繁荣的关键工具。OpenAI将与新加坡政府和其繁荣的AI生态系统合作,进一步扩展在亚太地区的业务。

大模型日报(10月9日 资讯篇)

https://techcrunch.com/2024/10/09/openai-to-open-offices-in-singapore-paris-brussels-to-facilitate-global-expansion/
04

Adobe提议保护艺术家免受AI盗用

Adobe在数字艺术领域的责任愈发重要,致力于减少AI驱动的深度伪造、虚假信息和内容盗窃。2025年第一季度,Adobe将推出内容真实性网络应用的测试版,允许创作者为其作品申请内容凭证,以证明其所有权。
Adobe的内容凭证系统使用数字指纹、隐形水印和加密签名元数据来保护艺术作品,超越简单的图像元数据修改。隐形水印对像素的改动微乎其微,以至于人眼无法察觉;数字指纹通过在文件中编码ID,即使凭证被移除,文件仍能被识别为原作者的作品。
Adobe内容真实性高级总监安迪·帕森斯表示:“无论图像、视频或音频文件在网络或移动设备上流传到何处,内容凭证始终会与之相伴。”
Adobe拥有3300万付费用户,能够有效触及数字艺术家。即使不是Adobe用户,艺术家也可以使用该应用申请凭证。为了促进内容凭证在互联网上的广泛使用,Adobe共同创立了两个行业组织,会员包括占市场90%的相机制造商及多个大型内容平台。

Adobe在数字艺术领域的责任愈发重要,致力于减少AI驱动的深度伪造、虚假信息和内容盗窃。2025年第一季度,Adobe将推出内容真实性网络应用的测试版,允许创作者为其作品申请内容凭证,以证明其所有权。

Adobe的内容凭证系统使用数字指纹、隐形水印和加密签名元数据来保护艺术作品,超越简单的图像元数据修改。隐形水印对像素的改动微乎其微,以至于人眼无法察觉;数字指纹通过在文件中编码ID,即使凭证被移除,文件仍能被识别为原作者的作品。

Adobe内容真实性高级总监安迪·帕森斯表示:“无论图像、视频或音频文件在网络或移动设备上流传到何处,内容凭证始终会与之相伴。”

Adobe拥有3300万付费用户,能够有效触及数字艺术家。即使不是Adobe用户,艺术家也可以使用该应用申请凭证。为了促进内容凭证在互联网上的广泛使用,Adobe共同创立了两个行业组织,会员包括占市场90%的相机制造商及多个大型内容平台。

大模型日报(10月9日 资讯篇)

https://techcrunch.com/2024/10/08/adobe-proposes-a-way-to-protect-artists-from-ai-ripoffs/
05

GR-2登场!ByteDance Research提出机器人大模型

GR-2是ByteDance Research开发的第二代机器人大模型,它在预训练阶段通过在3800万个互联网视频片段上进行生成式训练,学习了人类日常生活中的各种动态和行为模式。这种训练方式让GR-2具备了多种操作任务的学习和在多种环境中泛化的能力。

在微调阶段,GR-2通过在机器人轨迹数据上进行微调,能够预测动作轨迹并生成视频。它能够根据输入的图片和语言指令预测未来的视频,并生成相应的动作轨迹。这种视频生成能力不仅提升了动作预测的准确性,也为机器人的智能决策提供了新方向。

GR-2的Scaling Law表现在随着模型规模的增加,其性能显著提升。在7亿参数规模的验证中,GR-2展现出了处理更复杂任务和泛化到未见任务及场景的能力。

在多任务学习测试中,GR-2能够完成105项不同的桌面任务,平均成功率为97.7%。它不仅能处理已知任务,还能适应未知场景和物体,展现出强大的泛化能力。

GR-2还能与大语言模型结合,完成复杂的长任务,并与人类互动。它能处理环境中的干扰,并通过适应变化的环境成功完成任务。在实际应用中,GR-2能够端到端地完成物体拣选任务,无论是透明、反光、柔软物体还是其他挑战性物体,GR-2都能准确抓取。

尽管GR-2在互联网视频上接受了大规模的预训练,但真实世界动作数据的规模和多样性仍然有限,这表明它还有进步的空间。GR-2的故事展示了AI如何推动机器人发展,它不仅是一个机器人大模型,更是一个能够学习和适应各种任务的智能体。

大模型日报(10月9日 资讯篇)

https://mp.weixin.qq.com/s/h-69PKoCkPtj4_sq9589Tw
06

第三届年度语音创新大会Fullband 2024 


语音渠道洞察:

  1. 65% 的客户互动仍然通过语音进行。

  2. 业务端的主要问题是语音渠道的成本远高于其他渠道。

  3. 无论使用其他渠道与否,语音渠道能够全面覆盖客户需求,是客户互动的核心渠道。

  4. 80% 的客户仍然偏好通过语音获得人工支持。

  5. 口音和音质问题仍然是主要挑战,每年给联络中心带来 55亿美元 的损失。

  6. 语音机器人目前能处理多达 40% 的简单任务,使座席能够专注于更复杂的交互。

  7. 史蒂夫认为,鉴于行业规模及消费者偏好,语音机器人短期内不会完全取代人工座席。

  8. 客户面临的最大问题是长时间等待,这严重影响了客户满意度及整体体验,并且情况正在恶化。

  9. 语音机器人将被广泛用于初步筛查,从情绪强度、紧迫性和问题复杂性等角度分析问题,并相应分配给合适的座席

大模型日报(10月9日 资讯篇)

https://voice-ai-newsletter.krisp.ai/p/wrapping-up-fullband-2024

推特

01

Anthropic更新批处理 API:经济高效的方式,用于异步处理大量查询

介绍消息批处理 API——一种经济高效的方式,用于异步处理大量查询。

您可以一次提交多达 10,000 个查询的批次。每个批次将在 24 小时内处理完毕,且费用比标准 API 调用低 50%。

大模型日报(10月9日 资讯篇)

https://x.com/AnthropicAI/status/1843695536614060201
02

快速工具:将任何形式的 GitHub 链接转换为 LLM 可以读取的格式

我需要一个快速工具来将任何形式的 GitHub 链接转换为 LLM 可以读取的格式。

于是我开发了这个工具。

GitHub → LLM

完全免费,支持项目、文件夹或文件 🪄

部署在@Replit

大模型日报(10月9日 资讯篇)

https://x.com/skirano/status/1843732806763167912

03

Runway ml支持所有用户使用:输入第一帧和最后一帧,让 Gen-3 Alpha Turbo 生成视频

现在,您可以为 Gen-3 Alpha Turbo 提供首帧和末帧输入。所有用户均可在网页上使用,支持横向和纵向比例。

大模型日报(10月9日 资讯篇)

https://x.com/runwayml/status/1843707595141644617

04

Alex Volkov 分享Cursor 小技巧:从快捷指令到模型选用

今天我和@weights_biases 的同事们进行了一个“Cursor 小技巧”会议,我想分享一下我们之间‘发现’并讨论的内容:
首先,我们讨论了每个人使用的功能以及如何进行编辑,总结如下:有些同事尝试过 Composer,但还不是很习惯,CMD+K 很有用,但常常缺乏上下文,而聊天侧边栏总体上非常棒。
要点总结:
使用 Command+K 来编辑内联函数
当需要编辑多个文件时使用 Composer
使用聊天功能 (cmd+shift+L) 处理其他所有任务
上下文来源:
有些人不知道你可以在上下文中 @tag 进去的所有内容,所以我们一个一个讲解:
你可以添加特定的文件(和文件夹!),从网页上直接链接,参考当前或之前的 Git 更改,当然,还可以添加(并重新索引!)完整的文档站点。
关于引用文档的建议,有时候 @tag 整个文档站点很有用,但通常情况下,直接链接到你正在处理的特定文档效果更好(个人观察),这样还能为你节省 tokens。
模型:
我们深入讨论了 o1-mini 和 o1-preview,主要围绕是否根据不同任务切换模型。实际上,大多数人确实根据具体的使用场景切换模型,而不仅仅只是使用 sonnet。

大模型日报(10月9日 资讯篇)

大模型日报(10月9日 资讯篇)

https://x.com/altryne/status/1843738554352185542


05

Chunkr AI:从PDF转化成LLM可用结构的开源解决方案

PDF 是撒旦的文件格式。

几乎所有构建 RAG(检索增强生成)的人都必须处理它们——这真是糟透了。

市面上的解决方案要么太慢、太贵,要么不是开源的。

这一切本该更简单。因此我们开源了 http://chunkr.ai。

大模型日报(10月9日 资讯篇)

https://x.com/Ishaank1999/status/1843764968556278020

产品

01

Eddie AI

Eddie AI 是一款基于人工智能的视频编辑工具,通过文本提示快速生成粗剪,识别关键主题和音频片段,简化编辑流程。用户可以与其互动,调整视频内容并导出为 MP4,或在其他编辑软件中进一步处理,帮助创作者更专注于故事构建和创意实现。

大模型日报(10月9日 资讯篇)

https://heyeddie.ai/

02

Kvistly

Kvistly 是一个基于人工智能的测验制作工具,它允许用户快速创建自定义测验,并结合实时竞标和动态排行榜,增强参与者的互动和学习体验。

大模型日报(10月9日 资讯篇)

https://kvistly.com/

投融资

01

Alpha Design AI完成309万美元Pre-Seed轮融资

总部位于美国圣塔芭芭拉的Alpha Design AI公司成功完成了309万美元的Pre-Seed轮融资。本轮融资由ScOp Venture Capital领投,参与方包括Impact Assets、Amino Capital、半导体行业高管以及天使投资人。
Alpha Design AI开发了名为ChipAgents的AI工具,专为芯片设计和验证工作流程服务。公司计划利用此次融资加速其AI工具的开发和部署,帮助硬件工程师和半导体公司优化芯片设计流程。
ChipAgents由公司创始人兼CEO William Wang和创始顾问John Bowers教授领导,旨在通过生成式AI技术,为芯片设计团队提供自动化辅助工具。ChipAgents能够分析和生成RTL设计规范及代码,自动补全Verilog代码,并自动生成测试平台,从而减少繁琐的手动编码工作。该工具通过实时学习模拟结果,自动验证和调试设计代码,确保测试的全面性和高质量,显著缩短设计验证周期,提升生产力并降低开发成本。
公司官网:https://chipagents.ai/

大模型日报(10月9日 资讯篇)

https://www.finsmes.com/2024/10/chipagents-raises-3-09m-in-pre-seed-funding.html
02

Braintrust获得投资,开发AI产品工具

Braintrust是一家专注于大语言模型(LLM)产品开发工具的平台,近日获得了投资,进一步推动其工具平台的发展。该平台为基于LLM的产品开发提供了一整套支持,吸引了众多知名公司使用,如Notion、Stripe、Vercel、Airtable、Instacart、Zapier和Coda等。
Braintrust的工具涵盖LLM开发的多个核心功能,包括日志记录、提示模板管理、实时提示服务、代理支持以及工具集成等。特别是在产品开发中,Braintrust支持JavaScript/TypeScript,这使其不仅适用于小型项目,也适合复杂的开发需求。
Braintrust由创始人兼CEO Ankur Goyal领导,他的团队在AI开发平台建设方面经验丰富,曾在Figma和Goyal的前公司Impira参与相关工作。与传统的Python数据科学背景不同,Braintrust团队的系统背景使其在LLM状态管理等复杂问题上表现出色。
投资方表示,Braintrust为产品开发者提供了前所未有的开发体验,是未来AI产品开发的有力工具。
公司官网:https://www.braintrust.dev/

大模型日报(10月9日 资讯篇)

https://a16z.com/announcement/investing-in-braintrust/

03

Unify完成1200万美元A轮融资,专注于“暖外呼”信息

AI驱动的初创公司Unify成功完成1200万美元的A轮融资,由现有投资者Emergence Capital和Thrive Capital领投,OpenAI Startup Fund、Neo、Abstract、20Sales和AltCap也参与了此次融资。该公司在去年通过了OpenAI的Converge I加速器,并在该计划后获得了近700万美元的种子轮融资,投资者同样包括本次A轮的参与者。
Unify由Austin Hughes和Connor Heggie联合创立,Hughes曾在Ramp负责销售外呼项目,发现传统的冷邮件外呼效果逐渐减弱。由此他产生了利用数据和AI技术,帮助销售团队更好地接触潜在客户的想法。与Heggie合作后,他们开发了AI增强的“暖外呼”信息工具,帮助销售团队更快生成线索并促成交易。
尽管AI销售开发工具(AISDR)市场增长迅速,Unify并不定位为AISDR公司,而是通过整合CRM等数据源,提供个性化的外呼信息。Unify的AI系统通过扫描在线数据源,识别潜在客户及其购买信号,以实现更有效的外呼策略。Unify的客户已包括Justworks和Lattice等公司,其收入已达数百万美元。
公司官网:https://www.unifygtm.com/

大模型日报(10月9日 资讯篇)

https://techcrunch.com/2024/10/08/unify-an-openai-converge-accelerator-grad-lands-12m-for-warm-outbound-messages/

04

Distributional完成1900万美元A轮融资,致力于自动化AI模型和应用测试

AI测试平台Distributional由前英特尔AI软件总经理Scott Clark创立,近日完成了1900万美元的A轮融资,由Two Sigma Ventures领投。其他参与的投资者包括Andreessen Horowitz、Operator Collective、Oregon Venture Fund、Essence VC以及Alumni Ventures。截至目前,这家位于加州伯克利的初创公司已累计融资3000万美元。
Distributional的创始人Clark表示,公司的灵感来源于他在英特尔和Yelp工作时遇到的AI测试难题。该平台通过自动生成统计测试,帮助AI产品团队检测并解决AI模型在生产环境中的风险,从而降低操作失误的可能性。
Clark此前创立的模型实验和管理平台SigOpt在2020年被英特尔收购,之后他在英特尔的AI与超级计算软件部门担任副总裁及总经理。工作期间,Clark意识到AI模型的不可预测性使得监控和观测问题变得尤为棘手,这直接促成了他创办Distributional的想法。
Distributional的解决方案通过自动化测试和数据分布分析,帮助团队在开发周期中持续检测AI行为是否发生变化。该平台支持内部部署和托管计划,并与流行的告警和数据库工具进行集成。通过提供可视化的测试结果和可共享的测试模板,Distributional帮助团队标准化AI应用的测试流程。
随着此轮融资的完成,Distributional计划扩展技术团队,特别是在UI和AI研究工程方面。预计到今年年底,公司员工将增长至35人,并展开首批企业级部署。Clark表示,公司已经处于一个有利位置,能够在未来几年抓住这一巨大的市场机会。
公司官网:https://distributional.com/

大模型日报(10月9日 资讯篇)

https://techcrunch.com/2024/10/08/distributional-raises-19m-to-automate-ai-model-and-app-testing/

05

前亚马逊高管Dave Clark新供应链项目Auger获1亿美元种子轮融资

前亚马逊全球消费者部门CEO Dave Clark创立的供应链公司Auger,近日完成了1亿美元的种子轮融资。本轮融资由风险投资公司Oak HC/FT领投,资金将用于开发基于AI的供应链工具。
Clark此前曾在亚马逊和Flexport担任高管职位,期间积累了丰富的供应链管理经验。离开Flexport后,Clark决定创立Auger,致力于通过AI技术帮助依赖供应链的企业获得实时库存管理和运营数据,解决供应链中的信息碎片化和效率低下问题。
Clark表示,尽管企业在供应链技术上投入巨大,但现有的系统往往是各类不兼容技术拼凑的“碎片软件”,无法有效沟通,导致企业不得不依赖Excel等不适用于复杂供应链的工具。Auger将通过整合多种数据源,并利用AI和机器学习技术,提供动态的实时分析,帮助企业优化供应链规划、预测和融资。
目前,全球供应链管理市场需求强劲,物流软件市场预计到2025年将达到465亿美元。Auger面临的竞争对手众多,包括Altana、Everstream和Pando等公司,它们也在开发供应链可视化和管理解决方案。
尽管竞争激烈,Clark认为Auger将凭借独特的技术优势脱颖而出。Oak的合伙人Matt Streisfeld对Clark充满信心,称他是具备重新定义供应链管理软件潜力的“千载难逢的创始人”。
Auger目前尚未公布客户或收入情况,但Clark表示公司将在未来几个月内发布更多产品路线图和发展目标。
大模型日报(10月9日 资讯篇)

https://techcrunch.com/2024/10/08/dave-clark-formerly-of-amazon-and-flexport-just-landed-100m-for-new-supply-chain-venture/

推荐阅读
  1. 「出海日志」大模型时代的出海实践|活动专辑
  2. 「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

  3. 「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

    — END —

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/10/21562.html

Like (0)
Previous 2024-10-08 18:32
Next 2024-10-10 17:16

相关推荐