大模型日报(10月29日 资讯篇)

潜空间活动报名

本期活动将在11月9日 10:00开始,我们邀请到的嘉宾是鱼哲,Lepton AI 创始成员,曾在阿里云担任高性能 AI 平台产品负责人,专注于 AI 在多个行业的落地及应用。Lepton AI 致力于建立高效可用的AI 基础设施,让团队更关注于应用构建及落地。在本次分享中鱼哲将带来关于不同AI产品形态对团队的挑战相关的思考,分享主题《Beyond Infra, what matters?》。除嘉宾分享外,每期设置了【匹配合伙人 Cofounder Matching】环节。你可以和 GenAI 时代最有活力的创业者和研究者线下面对面交流,将有机会找到志同道合、有共同创业梦想的小伙伴。报名通道已开启,欢迎扫描下方二维码报名。

大模型日报(10月29日 资讯篇)

资讯

01

官方版“开源AI”定义出台

近日,开源倡议组织OSI(Open Source Initiative)发布了“开源AI定义”(OSAID)的1.0版本。这项定义为AI开源标准提供了正式框架,以便业界判断某个AI是否真正符合开源标准。以下为技术细节解析:
  1. 开源要求与重建可行性:OSAID要求AI模型必须披露足够的设计信息,使个人能够“实质性地”重建模型。具体包括训练数据的来源、数据处理方式,以及数据的获取与许可信息。这种透明度旨在让使用者能完整理解AI模型的构建过程。
  2. 使用与修改权限:符合OSAID的AI模型允许用户无需额外授权即可使用或修改,并提供自由的再开发空间。例如,用户可在此模型基础上进行改进,适用于任意用途。OSI希望此标准能有效防止不当使用“开源”名号。
  3. 对不符合标准的案例警示:尽管OSI没有执法权限,但将标记不符合OSAID的AI模型以纠正错误。某些公司(如Meta)称其AI为“开源”,但实际未满足OSAID的公开数据要求。例如,Meta要求月活用户数超700万的平台需额外许可才能使用其Llama模型。
  4. 数据透明性与法律挑战:OSAID要求公开训练数据的来源,但实际操作中,大型公司常依赖大量从社交媒体、网络抓取的“公开数据”来训练模型。这种做法使许多AI模型的数据透明性较低,并引发法律诉讼风险,如版权持有人对未经授权使用其作品提出的诉讼。
  5. OSAID的局限性与未来发展:现阶段OSAID未涉及数据许可的细节,因此,尽管模型满足OSAID要求,但训练数据可能需要高额费用或特殊许可。随着AI发展及知识产权法演变,OSI已设立委员会以修订OSAID,使其逐步适应行业与法律需求。
大模型日报(10月29日 资讯篇)
https://techcrunch.com/2024/10/28/we-finally-have-an-official-definition-for-open-source-ai/
02

强化学习训练一两个小时,100%自主完成任务

UC伯克利BAIR实验室的Sergey Levine团队近期提出了一个新的强化学习框架HIL-SERL,用于在现实环境中直接训练机器人完成视觉驱动的复杂操作。HIL-SERL通过结合人类的反馈与校正,在仅1-2.5小时的训练内便能使机器人在所有测试任务中达到100%的成功率,而传统基线方法的成功率仅约50%。该框架不仅能应对物体位置变化和外部干扰,还允许机器人灵活调整动作以完成任务。

HIL-SERL的核心技术包括:1)预训练的视觉网络进行策略学习以提升学习稳定性;2)结合RLPD的高效样本强化学习算法,集成人工演示与校正;3)设计低级控制器保障训练期间的安全性。HIL-SERL系统架构由actor与learner过程及重放缓存组成,actor负责与环境交互,learner优化策略,重放缓存存储演示与策略数据。人类通过SpaceMouse干预机器人,以提供策略校正,大幅提升了任务完成效率与鲁棒性,尤其在机器人初期容易陷入局部最优或不良状态时尤为关键。随着策略改进,人工干预频率和时长逐步减少。

在实验中,HIL-SERL展现了前所未有的训练速度和成功率。研究表明该系统在插USB、组装部件等任务中显著优于模仿学习和手动控制方法,并具备零样本适应性,能迅速应对任务干扰并保持高精度操作。HIL-SERL标志着基于强化学习的机器人操作进入高效、可扩展的通用化应用阶段。

大模型日报(10月29日 资讯篇)

https://mp.w‍eixin.qq.com/s‍/Jmdcb1yCHlVdfo-mTx‍Ohvg
03

首款M4 Mac诞生,库克:这是全世界最佳AI一体机

苹果正式推出Apple Intelligence AI功能,在iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1上免费更新。该系统利用苹果芯片优势,增强自然语言处理和生成能力,覆盖写作工具、照片智能处理、更自然的Siri等跨应用协作功能。新发布的M4芯片iMac全面提升性能,内建十核CPU与GPU,性能和能效核实现高效并行,支持复杂图像和视频编辑,AI性能比M1提高三倍。新款iMac配备4.5K Retina显示、纳米纹理玻璃和Center Stage摄像头,支持与iPhone联动和桌面视角显示。
Apple Intelligence的写作工具支持全系统内容生成、润色、校对和重写,提升写作效率;Siri得到深度升级,可在桌面随时唤起,支持上下文流畅切换,并对苹果产品功能深度整合。照片搜索和视频生成方面,通过自然语言描述即可精准查找或生成影片,智能完成建议助力快速定位内容。此外,「优先消息」和「减少打扰」等通知管理功能帮助用户高效处理邮件和通知。未来,Image Playground和Genmoji等功能将陆续上线。苹果重申隐私保护,不存储用户数据,为个性化AI体验保驾护航。

大模型日报(10月29日 资讯篇)

https://mp.w‍e‍ixin.qq.com/s/uJ4bwe3HO2yHrqoml1iO1g
04

免训练大模型知识编辑,吸收新数据更高效|EMNLP’24

这项被EMNLP 2024接收的新研究提出了RECIPE,一种增强检索的连续提示学习方法,以提高大语言模型(LLM)的知识编辑和推理效率。RECIPE的核心是通过将知识描述转换为简短的信息丰富提示作为LLM的输入前缀,从而动态集成知识,解决了传统方法中灾难性遗忘和性能衰退的问题。该方法引入“知识哨兵”机制,用于计算动态阈值,判定知识库中是否包含相关信息;检索器和提示编码器联合训练,实现了可靠性、通用性和局部性要求。
相比之前的方法,RECIPE避免直接干预LLM参数,通过动态短提示有效编辑知识,降低了对原始推理能力的影响。在ZSRE、CF和RIPE等数据集上的终身编辑实验表明,RECIPE在应对逐步累积的编辑需求时性能优越。此外,在CSQA、ANLI等常识推理评估中,RECIPE对LLM通用能力的影响最小。其低时间消耗和推理速度优点凸显了相较于MEND、MALMEN等编辑方法的效率,尤其是避免了参数过度调整带来的过拟合问题。
大模型日报(10月29日 资讯篇)

https://mp.weixin.qq.com/s/aW6Vm2ZTieeyKfHNz9UIow

05

鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库

腾讯悄悄上线的 ima copilot,能将微信公众号优质内容变成专属知识库,还具备多种功能:
  1. AI 搜索功能
    1. 可检索微信公众号文章,虽引用资料部分不相关内容会在总结中剔除。
    2. 深度研究模式需从初步检索结果切入,点击检索结果中的文章链接,右上角 “问问 ima” 按钮可生成总结并记入笔记,还会提供可能想问的问题。
    3. 支持多模态,能通过上传图片或截图提问。
    4. 可当 AI 浏览器用,输入网页链接可自动跳转并总结内容,本地文档也可一键总结,支持最高 500 页、不超 100MB 的文档,桌面可直接拖入。
  2. 知识库功能
    1. 入口在左侧边栏灯泡按钮,用户有 1GB 知识库空间。
    2. 导入内容方法有直接上传本地文档和收藏搜索结果或浏览网页,导入后可在 “基于知识库” 模式下提问,答案受知识库素材质量影响大,使用前需把关内容准确性和可用性。
  3. 记笔记功能
    1. 可在 AI 搜索、总结后点击新建笔记将内容导入,格式编辑栏功能常见,支持列待办清单、插入图片等。
    2. 选中词能进行 AI 写作和解读,写作支持输入 Prompt 及扩写、缩写、翻译,翻译支持多种语言,输入斜杠 “/” 也可唤出 AI 写作功能,还能让它画笔记配图。
大模型日报(10月29日 资讯篇)

https://mp.weixin.qq.com/s/fWIDcB18CvzSqmYuLaAzmw

推特

01
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式

Co-STORM发布:用于信息检索的人机协作工作空间

我们很高兴发布 Co-STORM🌩️ — 一个用于信息检索的人机协作工作空间;它在设计理念上与 OpenAI Canvas 有一些相似之处!
Co-STORM 让人类能够与 AI 一起观察、互动和探索,并已被 #EMNLP2024 接收!
今天就来体验一下吧!
大模型日报(10月29日 资讯篇)
https://x.com/YuchengJiang0/status/1850925017049280527
02

Just分享Rotato:把视频编辑器放进了一个文本框里,快捷、简单编辑视频

我一直在想,为什么简单的视频编辑这么难,所以我把视频编辑器放进了一个文本框里。
https://video.rotato.app/

大模型日报(10月29日 资讯篇)

https://x.com/mortenjust/status/1850835466418827482
03

吴恩达:初创企业的生死取决于其快速执行的能力,在生成式AI的背景下该如何快速进步?

初创企业的生死取决于其快速执行的能力。对于大型公司来说,创新团队快速迭代的能力也对成功的可能性产生巨大影响。生成式AI使快速原型设计AI功能成为可能。以往需要几个月才能完成的AI功能,现在通过大语言模型的简单提示,有时可以在几天甚至几小时内完成。我对此速度感到兴奋,并一直在思考如何帮助初创企业和大型公司实现更快的进步。
我一直对快速执行充满热情。在项目中,如果一项工作能在一周内完成,我绝不会拖到两周。以这种速度前进的代价并不是多花一周时间(这也许还可以接受),而是让我们效率减半(这是无法接受的)!
在构建AI驱动的产品时,设计、开发、发布和扩展产品的许多步骤与构建AI功能的过程不同。而这些其他步骤的执行速度并未像AI那样大幅提升。然而,我们快速原型AI的速度给这些其他步骤带来了巨大的加速压力。如果过去需要6个月来收集数据、训练监督学习算法并将模型部署到云端,那么花2个月获取用户反馈还可以接受。但现在如果一周内就能构建原型,那么等待2个月的反馈似乎过于缓慢!
我想专注于构建应用程序的关键步骤之一:获取用户反馈。Eric Ries在他的书《精益创业》中推广的迭代工作流程核心在于构建原型(或MVP,最小可行产品),获取用户反馈并用这些反馈来驱动改进。越快地完成这一循环——可能需要多次迭代——就越快能设计出适应市场的产品。这就是为什么我领导的AI Fund风险工作室会采用许多快速、灵活的策略来获取反馈。
针对B2C(面向消费者)的产品,以下是一些获取客户反馈的选择:
1. 让3位朋友或团队成员看看产品并给出反馈(大约0.5天)。
2. 让10位朋友或团队成员参与测试(约2天)。
3. 发送给100位信任的/志愿者内测者(约1周)。
4. 发送给1,000位用户以获取定性或定量反馈(约2周)。
5. 将其集成到现有产品中以获取反馈(1至2个月)。
6. 向现有产品的大量用户推出并进行严格的A/B测试。
随着列表向下,反馈可能会更加准确,但获取这些反馈的时间显著增加。此外,列表顶部的策略基本没有风险,因此即便在最初的想法和原型阶段也可以反复使用。列表顶部策略的另一个优势是可以获得更多的定性反馈(例如,用户是否感到困惑?他们是否表示确实需要一个额外的功能?),这比A/B测试更能激发产品改进的思路,而A/B测试虽然严谨,但更侧重验证特定实现是否有效,较少引导新的尝试方向。我建议优先使用快速反馈的策略。在快速学习选项用尽后,我们可以尝试较慢的策略。
通过这些策略,初创企业的领导者和大型公司创新团队的负责人可以加快进展,并大幅提高成功的可能性。
“快速行动并打破常规”这一口号因为过于“破坏性”而饱受批评。不幸的是,一些人因此误解为不应该快速行动,但我并不认同。更好的口号是“快速行动且负责任”。我们有很多方法可以在不发布高风险产品的情况下快速原型设计和测试。事实上,在向大规模用户推出之前快速进行原型设计和测试/审查,是发现和减轻潜在问题的良好方式。
未来充满了AI的机会,我们的工具也在不断升级,让我们可以以更快的速度追求这些机会,令人振奋!
大模型日报(10月29日 资讯篇)
https://x.com/AndrewYNg/status/1850912176896463328
04

Centaur:首个人类认知基础模型,可以预测并模拟任何用自然语言表达的实验中的人类行为

激动地宣布 Centaur —— 首个人类认知基础模型。Centaur 可以预测并模拟任何用自然语言表达的实验中的人类行为。你可以直接从 @huggingface 下载该模型并自行测试:
大模型日报(10月29日 资讯篇)
https://x.com/marcel_binz/status/1850806691958313160
05

Together发布新Cookbook:Anthropic 发布的开源实现,Contextual RAG

新手册:Anthropic 发布的开源实现——Contextual RAG!
简而言之,包括以下步骤:
1. 使用 Llama 3.2 3B 高效生成每个片段的上下文
2. 构建两个数据索引:向量索引和 BM25
3. 使用互惠排序融合进行混合搜索
4. 对混合搜索结果进行重新排序
5. 使用 Llama 3.1 405B 生成
详见下方链接!
大模型日报(10月29日 资讯篇)
https://x.com/togethercompute/status/1850939031301099919

产品

01

APIPark

APIPark 是一个开源的 AI 网关和 API 开发者门户,可以帮助用户轻松管理和部署 AI 服务。它支持与多种 AI 模型集成,允许用户创建标准化的 API,简化 AI 的使用和维护。APIPark 提供高性能的 API 管理功能,适合大规模流量处理,且完全免费,助力快速构建产品和 AI 代理。
大模型日报(10月29日 资讯篇)
https://apipark.com/
02

Chat2DB

Chat2DB 是一款 AI 驱动的数据库管理和分析工具,支持自然语言生成 SQL 查询,提供实时数据洞察,能够快速构建 BI 仪表板,并且具备离线使用功能,简化数据管理和分析过程。
大模型日报(10月29日 资讯篇)
https://chat2db-ai.com/

投融资

01

Read AI获5000万美元融资,加速AI机器人多平台集成

Read AI近日完成5000万美元的B轮融资,此次融资由Smash Capital领投,仅距离其今年早些时候完成的2100万美元A轮融资六个月。Read AI联合创始人David Shim表示,自A轮融资以来,公司用户和月度经常性收入翻倍,增长迅速,现已获得超过10万家企业和个人用户。资金将主要用于加速产品开发,进一步扩展其AI机器人的多平台集成功能,如Slack、邮件、HubSpot、Jira和Confluence。
投资方与产品驱动增长:Smash Capital的Brad Twohig指出,投资Read AI的原因在于其产品驱动增长模式,能够服务于广泛的用户群体,同时兼具企业用户的需求。此类业务模式有助于企业快速占领市场,满足不同场景中的实际需求。
扩展与市场布局:Read AI目前推出了一款免费的Chrome扩展程序,帮助用户从繁杂的邮件和会议记录中提取关键信息并生成邮件草稿。公司计划利用新一轮融资进一步拓展功能,将AI助手无缝嵌入用户的日常办公流程中,同时将团队规模扩展至100人,以满足市场需求。
此次融资还吸引了现有投资者Madrona和Goodwater Capital的参与,进一步巩固了Read AI在AI办公助手领域的市场地位。
公司官网:https://www.read.ai/
大模型日报(10月29日 资讯篇)
https://techcrunch.com/2024/10/28/read-ai-raises-50m-to-integrate-its-bot-with-slack-email-and-more/
02

Bret Taylor的客户服务AI初创公司Sierra完成1.75亿美元融资,估值达45亿美元

由OpenAI董事长Bret Taylor与Google前高管Clay Bavor共同创立的AI初创公司Sierra,近日完成了1.75亿美元的融资,使其估值达到45亿美元。本轮融资由Greenoaks Capital领投,ICONIQ和Thrive Capital参投。这笔资金使Sierra的总融资额达到了2.85亿美元。
Sierra专注于为企业提供AI驱动的客户服务聊天机器人,已吸引诸如WeightWatchers和Sirius XM等品牌客户。其技术的特点在于结合多家AI技术(包括OpenAI、Anthropic和Meta等)以提供更高精度、个性化的客户服务,并通过“星座”式的AI模型集群进行信息验证,减少“幻觉”式错误输出。Sierra的AI还可以根据企业品牌定制化,以确保符合品牌风格。
Taylor和Bavor均在客户服务技术领域拥有深厚背景。Taylor曾在Salesforce任职近十年,还创建了Quip,后被Salesforce以7.5亿美元收购。Bavor则在Google负责Gmail和Google Drive等项目。此次融资将帮助Sierra进一步发展其AI技术,增强在竞争激烈的客户服务AI市场中的地位。
公司官网:https://sierra.ai/
大模型日报(10月29日 资讯篇)
https://techcrunch.com/2024/10/28/bret-taylors-customer-service-ai-startup-just-raised-175m/

推荐阅读

— END —

1.   The theory of LLMs|朱泽园ICML演讲整理

2.   「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

3.   「奇绩潜空间」吕骋访谈笔记 | AI 硬件的深度思考与对话

原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/10/21645.html

Like (0)
Previous 2024-10-29 19:53
Next 2024-10-30 09:49

相关推荐