我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢 迎 大 家 一 起 交 流 !
资讯
联想创新科技大会2024
在2024年联想创新科技大会上,联想携手全球AI领域的领军人物,如英伟达的黄仁勋、AMD的苏姿丰等,共同展示了AI技术的最新进展和产品。会上,联想推出了一系列AI驱动的产品,包括个人AI智能体、液冷服务器,以及AI手机等。这些产品展示了AI技术在个人计算、企业服务和公益领域的广泛应用。
联想的AI Now个人AI智能体能够提供个性化服务,如无缝传输笔记和图片、生成宣传海报、辅助学习等。企业AI方面,联想推出了第六代Neptune海神液冷解决方案,以提高能效并支持更大规模的服务器运行。此外,联想还展示了AI在自动驾驶、混合现实等领域的应用。
会上,英特尔和AMD宣布了史无前例的合作,组建x86生态咨询小组,以推动x86架构的创新和发展。黄仁勋强调了AI智能体的重要性,认为它们将成为未来的操作系统,而英伟达将助力创造数十亿的AI智能 体。
https://mp.weixin.qq.com/s/H-gj_TMpnDA-y3pGEp4IVA
OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好
openAI最新发布的53页论文指出,ChatGPT在与用户互动时,会根据用户名推断性别、种族等身份特征,并可能重复训练数据中的社会偏见。例如,对于相同的问题,如果提问者名为“小美”,ChatGPT可能将其与幼儿教育相关联;而如果提问者名为“小帅”,则可能关联到电子和计算机工程。此外,ChatGPT在讲故事时,也倾向于设定与提问者性别一致的主角,以增强用户的代入感。
研究还发现,女性名字更可能得到语气友好、通俗的回复,而男性名字则更多收到专业术语。尽管总体差异不大,但这一模式引起了关注。OpenAI强调,有害回复的出现率仅约0.1%,研究的目的是为了展示研究中的情况。
研究的目的是为了评估聊天机器人在不同场景下的偏见,如推荐电影等娱乐场景,以及筛选简历等严肃场景,后者可能影响社会公平。研究方法上,团队使用了一个大模型作为“语言模型研究助手”,在保护隐私的前提下分析Chatbot回应的敏感性。
研究发现,在开放式任务如写故事中,有害刻板印象的可能性更高。通过对比不同模型版本,发现较新的模型在所有任务中的偏见均低于1%。此外,增强学习技术可以显著减轻有害刻板印象,显示出后训练干预的重要性。
这项研究为评估聊天机器人中的第一人称公平性提供了一套系统、可复现的方法,尽管存在局限性,如目前仅关注了英语对话、种族和性别覆盖有限等,未来研究将拓展到更多人口统计属性、语言环境和对话形式。
https://mp.weixin.qq.com/s/NnLAjHuBPHa-aBoT6IV4Pg
清华聂再清:大模型解码生物语言
2024年诺贝尔化学奖突显了AI在生物领域的重要作用。AI技术在生物医药领域的应用前景广阔,但药物研发的”双十”魔咒(10年时间、10亿美元投入、10%成功率)仍是行业难题。清华大学聂再清教授在自然语言处理技术应用于生物医药数据分析方面取得创新进展,他和团队构建的生物医药大模型ChatDD,旨在通过自然语言交互,整合行业数据和工具,提升药物研发效率。
ChatDD通过多模态大模型,融合自然语言和生物数据,实现智能助手功能,帮助专家进行药物研发。聂教授认为,生物医药领域适合研发垂直大模型,因为该领域有独特语法的数据,这对性能影响显著。ChatDD目前已在立项、临床前药物研发和临床试验等环节发挥作用,通过人机协作弥补当前AI技术的不足。
聂教授还探讨了药物研发的未来,强调人机协作的重要性,ChatDD将结合专家经验和大模型能力,通过不断交互找到解决方案,目标是成为行业不可或缺的智能助手。他提出,行业入口模式将是未来的重要盈利模式,ChatDD有望整合行业工具,成为生物医药领域的应用商店。
访谈中,聂教授分享了在自然语言与生物数据融合、多尺度建模与融合等方面的前沿研究成果,展示了AI赋能药物研发的新可能。他强调了构建行业基座大模型的重要性,以及通过多任务学习提升模型泛化能力的方法。聂教授还介绍了水木分子在数据整合和知识库建设方面的工作,以及ChatDD在实际应用中的潜力和商业模式。
https://mp.weixin.qq.com/s/8dmUMfyxNEdFjk56oIBlFw
实测13个类Sora视频生成模型
腾讯AI Lab联合中科大发布了一份针对类SORA视频生成模型的测评报告,聚焦于高质量视频生成模型的技术进步。报告涵盖了文生视频、图生视频和视频到视频生成模型的能力评估,测试了13个主流模型,生成了超过8000个视频案例。测评从视频垂类场景、客观评价角度、十大视频应用场景及用户需求等多维度进行,设计了700多个生成提示词和图片,全面测试了模型的基础能力和应用落地能力。
报告的亮点在于对模型在垂直领域应用的深入对比,如人为中心的视频生成、机器人、动画插帧等。此外,还探讨了视频生成领域的挑战和未来研究方向,包括复杂动作理解与生成、概念理解等。所有生成结果均公开并持续更新,为视频生成研究提供了新的基准。
文章强调了人眼观感在视频生成评估中的重要性,提供了直观的测评方式,让读者可以直接观看并对比多个模型的生成结果。这种“眼见为实”的评估方法为行业带来了透明度和参考价值。报告还指出了开源和闭源模型在训练资源、模型规模、数据质量与数量等方面的差距。
最后,报告对未来视频生成技术的突破持乐观态度,期待技术进步能降低视频创作门槛,释放更多创意。同时,报告也指出了人工智能发展正处于规模化阶段,未来将进入以研究和创新为主导的阶段,数据生产和模型评估将变得至关重要。为了方便研究人员和用户查看和对比,报告在网站上提供了视频对比所有模型的查看方式以及单个模型单独查看模式。
https://mp.weixin.qq.com/s/ISmjI87bB529sEFz7feLMg
前Palantir首席信息安全官Dane Stuckey加盟OpenAI领导安全团队
分析公司Palantir的前首席信息安全官(CISO)Dane Stuckey已加入OpenAI,担任新的CISO,与OpenAI安全负责人Matt Knight共事。Stuckey在周二晚间宣布了这一变动,并强调了安全对OpenAI使命的重要性,提到保护数亿用户的产品安全、支持民主机构以及推动安全AGI发展的重要性。他在Palantir的工作经验可能有助于OpenAI在政府合同方面的发展。自今年1月解除对军方销售AI技术的禁令以来,OpenAI已与五角大楼合作多个软件项目,包括网络安全相关项目,并任命前国家安全局局长Paul Nakasone为董事会成员。近几个月来,OpenAI一直在加强其运营的安全方面,包括发布招聘信息,寻找负责可信计算和密码学的负责人,以构建“安全的AI基础设施”
https://x.com/skirano/status/1846266799610122709
推特
全球首个AI营销团队:将您的简要转化为500个独特的营销视觉效果
遇见由@everartai推出的活动——全球首个AI营销团队。
生成令人惊叹的资产,达到AI前所未有的创造力水平。
我们的专业团队将您的简要转化为500个独特的营销视觉效果。
https://x.com/skirano/status/1846266799610122709
Ditto:简单的自构建编码代理
https://x.com/yoheinakajima/status/1846289276151255187
Unsloth AI分享梯度累积修复方案:修复LLM训练中的错误
今天,我们发布了一种新方法,改进了每个人训练LLMs的方式。
训练过程中存在一个重大错误,导致损失计算出现偏差。我们的梯度累积修复方案解决了这个问题,将L2范数误差减少了超过10倍。
博客详情:http://unsloth.ai/blog/gradient
在过去的一周里,我们一直在修复梯度累积中的一个普遍问题,这个问题对LLM等序列模型的训练、预训练和微调运行产生了负面影响。Unsloth的梯度累积修复确保了训练运行和损失计算的准确性和正确性。
梯度累积的目标是通过减少VRAM使用来模拟全批次训练。梯度累积还用于DDP和多GPU设置,因此这个问题也影响了大规模训练运行。
早在2021年,Zhaofeng首次发现了这个问题,而Benjamin Marie在上周再次发现了该问题。他们展示了如果使用梯度累积,损失值会比使用全批次训练时更高。
https://x.com/UnslothAI/status/1846231235749990699
Anthropic宣布《负责任扩展政策》:用来减轻前沿AI系统潜在灾难性风险的风险治理框架
我们发布了《负责任扩展政策》的重大更新,该政策根据AI模型的能力匹配安全与保障措施。
今天,我们发布了《负责任扩展政策》(RSP)的重大更新,这是我们用来减轻前沿AI系统潜在灾难性风险的风险治理框架。此次更新引入了一种更灵活且更细致的方式来评估和管理AI风险,同时我们依然承诺在未实施充分保障措施的情况下,不会训练或部署模型。主要改进包括新的能力阈值,用于指示何时升级我们的保障措施;优化了评估模型能力和保障措施充分性的流程(受到安全案例方法的启发);并引入了新的内部治理和外部意见措施。通过从实施经验中学习并借鉴其他高风险行业的风险管理实践,我们旨在更好地为AI快速发展的步伐做好准备。
https://x.com/AnthropicAI/status/1846194917720088721
新PIKAFFECT:让物体崩塌、溶解、瘪气和“Ta-Da”效果
现在你可以让物体崩塌、溶解、瘪气和“Ta-Da”效果。
https://x.com/pika_labs/status/1846295401491845213
产品
Headshot Photo
headshotphoto.io 是一个在线服务平台,允许用户将日常自拍转换为专业头像。用户可以选择多种风格和背景,适合不同的个性和行业需求。该服务提供快速的处理时间。
https://www.headshotphoto.io/
投融资
Xscape Photonics获巨额融资推动多色激光技术发展
Xscape Photonics是一家专注于通过硅光子技术提高数据中心内芯片间连接带宽的初创公司。该公司最近完成了4400万美元的A轮融资,使得其总融资额达到了5700万美元。本轮融资由IAG Capital Partners领投,Cisco Investments、NVIDIA等公司参与投资,显示出市场对Xscape Photonics技术的高度认可和期待。
Xscape Photonics的技术核心在于使用多色激光来实现数据中心内芯片间的高带宽连接。与传统的金属线连接相比,这种基于光的技术能够显著减少能耗和热量产生,同时提高数据传输速度。公司的第一个产品是一种可编程激光器,它能够利用不同颜色的光(即波长)在同一链接上传输多个数据流,而不会产生干扰。
Xscape Photonics的团队由来自哥伦比亚大学的教授和光子学领域的世界领先研究人员组成,他们在硅光子学和光子频率梳技术方面拥有深厚的背景和丰富的经验。公司的技术起源于哥伦比亚大学的一个实验室,三位教授发明了一种他们认为可以用来通过光传输大量数据的技术。
此次融资将为Xscape Photonics提供资金支持,以扩大其24人团队,并增加其激光器及相关光子技术的制造规模。公司目前已经与10家客户积极接洽,探讨潜在的部署合作,这些客户包括供应商和超大规模计算公司。此外,Xscape Photonics的激光器可以利用现有的微电子制造设施进行生产,这可能成为其在光子学领域竞争对手如Ayar Labs和Celestial AI的一个优势。
总的来说,Xscape Photonics的融资成功和技术创新,不仅为其自身的发展提供了动力,也为数据中心和高性能计算领域的进步带来了新的可能。随着数据中心对高带宽连接需求的不断增长,Xscape Photonics的多色激光技术有望在未来发挥重要作用。
公司官网:https://www.xscapephotonics.com/
https://techcrunch.com/2024/10/15/xscape-is-building-multicolor-lasers-for-datacenters/
Amplitude收购Command AI以增强应用交互产品
数字分析软件公司Amplitude宣布收购应用用户参与初创公司Command AI,以提升其产品的应用内交互能力。Command AI的技术将使Amplitude能够提供个性化的用户帮助,如产品内导览和入职体验等。Command AI团队的大部分成员将加入Amplitude,但交易的具体条款未披露。据消息人士透露,交易价值可能超过4500万美元。
Command AI由James Evans、Richard Freling和Vinay Ayyala于2021年创立,旨在帮助开发者轻松集成搜索功能到Web应用程序中。该公司的产品包括应用内搜索栏、聊天机器人和AI协同浏览等,已获得包括Insight Partners在内的投资者2380万美元的资金支持。
Amplitude计划在明年年初推出基于Command AI技术的新产品,包括清单和指南工具,以及允许客户在应用程序中设置智能触发器的功能。此次收购是Amplitude自十年前成立以来的第三次收购,前两次分别是对预测分析公司ClearBrain和数据管道公司Iteratively的收购。
Amplitude目前拥有2,700多名付费客户,包括财富100强中的26家公司。Command AI的联合创始人James Evans和Vinay Ayyala将分别担任Amplitude的产品总监和工程总监,并监督新Command AI产品组织的运营,直至平台整合完成。
公司官网:https://www.command.ai/
https://techcrunch.com/2024/10/15/amplitude-buys-command-ai-to-bolster-its-app-engagement-offerings/
OutRival 获资金支持以构建 AI 代理服务
OutRival 是一家由 Career Karma 创始人 Ruben Harris 和 Timur Meyster 推出的新公司,专注于为企业提供构建 AI 代理的托管服务,以改善客户服务体验。尽管 AI 代理市场竞争激烈,OutRival 凭借其创新服务在市场中获得关注。根据《华尔街日报》报道的 PitchBook 数据,AI 行业在 2022 年已吸引了至少 641 亿美元的风险投资,其中三分之一流向了 AI 初创公司。OutRival 利用 Career Karma 在 2022 年筹集的 4000 万美元 B 轮融资的剩余资金,并得到了包括 Jack Altman 和 Initialized Capital 在内的投资者的支持。OutRival 的目标是帮助企业轻松构建与现有工具和系统配合使用的 AI 代理,以区分其服务并提升客户体验。公司已与大学的招生团队合作,简化工作流程,并计划扩展到其他行业。Career Karma 将继续作为独立公司运营,现在由 OutRival 拥有。
公司官网:https://outrival.com/
https://techcrunch.com/2024/10/15/career-karma-founders-launch-outrival-to-help-companies-build-ai-agents/
Concourse公司获投470万美元开发AI财务自动化平台
Concourse是一家致力于开发财务自动化工具的初创公司,近日宣布完成了由Andreessen Horowitz(a16z)领投的470万美元种子轮融资。投资方还包括Y Combinator、CRV和BoxGroup等知名机构。这笔资金将用于产品研发、团队扩展以及市场推广。
Concourse由前Andreessen Horowitz的投资人Matthieu Hafemeister与Ted Michaels共同创立,旨在通过AI技术自动化处理复杂的财务任务,如数据提取、分析和报告生成。该平台已经吸引了包括Instabase和Shef在内的多家客户,目前还处于测试阶段,计划于明年正式推出。
Hafemeister表示,此次融资将主要用于扩大工程团队,特别是后台、机器学习和AI领域的招聘,以进一步完善数据集成和工作流功能。他们的目标是为财务团队提供一体化的自动化解决方案,减少繁琐的手动工作,提高财务分析的准确性和效率。
Concourse的愿景是在财务领域通过AI实现多步骤、复杂操作的完全自动化,这在当前依赖Excel等传统工具的财务部门中将带来显著提升。
公司官网:https://www.concourse.co/
https://techcrunch.com/2024/10/15/concourse-is-building-ai-to-automate-financial-tasks/
Gladia公司完成1600万美元A轮融资,专注实时音频转录API
法国初创公司Gladia专注于提供高效的语音识别API,最近完成了1600万美元的A轮融资,由XAnge领投,其他投资方包括Illuminate Financial、XTX Ventures、Athletico Ventures等。这笔资金将用于推动实时音频处理技术的发展,并进一步提升其语音转录服务的质量和速度。
Gladia的API能够将音频文件快速准确地转换为文本,支持100种语言和多种口音,解决了多个发音问题。与市场上的大公司(如亚马逊、微软、谷歌)相比,Gladia凭借更精确的模型脱颖而出,并得到了包括Attention、Circleback、Method Financial等在内的600多家客户的认可。
此次融资将帮助Gladia进一步简化语音到文本再到AI模型处理的工作流程,目标是将实时处理的延迟控制在300毫秒以内,并达到批处理的质量标准。这种实时转录技术有望在呼叫中心、AI通话代理等领域带来变革,为用户提供更流畅的体验。
Gladia正在探索“音频应用的ChatGPT时刻”,希望通过简化开发者的集成流程,推动自动化转录在日常应用中的普及。
公司官网:https://www.gladia.io/
https://techcrunch.com/2024/10/15/gladia-believes-real-time-processing-is-the-next-frontier-of-audio-transcription-apis/
— END —
1. The theory of LLMs|朱泽园ICML演讲整 理
原创文章,作者:LLM Space,如若转载,请注明出处:https://www.agent-universe.cn/2024/10/21588.html