智能体:太好了是语音交互新功能,我们说话有救了! 特工宇宙 • 2024-11-15 19:47 • 产品 • 212 views 你是否经历过,给客服打电话总是遇到让人高血压的 AI? 买的智能音箱对话时总是被错误识别? 以及,最新的 AI 陪伴机器人总是感觉有点呆板? 提效不明显,也提供不了足够的情绪价值… 语音交互体验成为了 AI 落地的一块绊脚石。 而如今扣子推出的技术,有望使这种情况成为过去式。 经过近两年来的发展与验证,大语言模型(LLM)和智能体(Agent)已经逐渐成为行业共识,落地到了生活各处。 AI 游戏陪玩、AI 虚拟陪伴、AI 口语陪练、AI NPC等应用遍地开花,由此也激发了对更优质的 AI 语音交互的强烈需求。 不少产品的语音过于机械,响应速度过慢…这种“对讲机式”的对话,极大的降低了用户体验。 对此,扣子上线了全新的智能语音 OpenAPI,让 AI 从“能说话”到“会说话”。 此前的所有方案,都是在用工程思维处理人文问题。 Google Assistant 虽然能识别几十种语言,却理解不了“中式英语”;Alexa 虽然能控制一整个智能家居,却无法自然地应对打断;Siri 虽然能讲笑话,却始终没有真实的情感温度… 而扣子的方案,首次将“理解”的能力注入了整个语音交互链路。 它不只是在听你说话,而是在理解你说话的场景、语境、甚至情绪。 这让 AI 终于开始像人一样思考和表达。 基于扣子这套“组合拳”做出来的智能体或是 AI 应用,当你跟它交谈时,它不只是在应答,而是在理解、思考、然后用最恰当的方式回应! 这一切的实现归功于以下四个核心突破: 1. 精准语音识别:使用 ASR 语音转成文本,且具备上下文理解能力(比如上文出现过的名词等信息能够在识别中复用,说话等风格和代称也能理解的较好),并对中英混说、噪音、垂直领域等复杂场景识别效果有所提升; 2. 强大的 AI Agent 能力:扣子不只听懂你所说的,更能真正理解你的需求。它拥有 Agent 的各项能力,能够像人一样有记忆力(文件盒子、数据库、变量)、有知识(文本、表格、照片)、有技能(插件、触发器)、还能编排(工作流、图像流)等; 3. 低延迟、可打断:使用了火山引擎 RTC 方案,将链路中的延迟充分降低,并确保即使在弱网络环境下也能通话顺畅。此外,智能体能毫秒级响应用户打断,流畅切换话题并即时反馈,通过火山引擎 RTC 的智能降噪技术,能有效过滤 90% 以上的背景噪音,降低误触发概率,提升对话质量; 4. 自然的语音效果:使用大模型的 TTS 进行文本转语音,根据上下文,智能预测文本的情绪、语调等信息;生成超自然、高保真、个性化的语音,在自然度、音质、韵律、气口、情感、语气词表达等方面更像真人;即使是中英文混说也能行云流水应答自如。 通过将 Agent 的认知能力引入整个语音交互链路,扣子让 AI 首次具备了真正的“对话感”。 以下是实测演示👇 1. Demo 配置流程视频演示。 2. 与智能体实时对话测试。 3. 语音对话过程中,支持实时打断。 4. 轻松完成逼真的音色克隆。 目前该功能还在内测,有相关需求可以在下方链接或点击阅读原文申请。 https://www.coze.cn/survey/7431180581536268314?FG_source=15 回望 AI 发展史,从最初的命令式交互,到基于规则的对话,再到今天的自然语音交流,我们一直在试图跨越人机之间的鸿沟。 扣子的这次突破,终于让AI具备了真正的“理解力”——不是简单的听和说,而是像人一样思考、表达与回应。 这绝对不是简单的功能叠加,而是交互范式的革新,是智能体走向真正智能的关键一步。 原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2024/11/21699.html Like (0) 0 Generate poster 关于作者 特工宇宙 大模型日报(11月15日 学术篇) Previous 2024-11-15 19:23 糟糕!我被 AI 电影包围了! Next 2024-11-16 17:49 相关推荐 产品 MolarData| 热“AI”身边新鲜事 新鲜趣闻周五见 MOLAR FRESH 2020年第3期 MolarData人工智能新鲜趣闻,每周五更新。 鸿蒙2.0系统震撼发布,华为可与安卓一战了! 当全世界都认为华为即将按下「暂停键」时… 2020-09-11 1840 产品 真格天使项目「官栈」完成B轮融资 真格很荣幸可以在首轮独家投资官栈,并陪伴公司成长。过去两年半,官栈团队一直保持初心,不断进行基础研发,迭代原材料,优化供应链,推陈出新。 在充满不确定性的 2022 年,我们见证了… 2022-12-15 2500 产品 GPT-3迎来新对手;轻量化模型展奇功;一体化机器学习平台造福生信;3D人脸生成模型再突破;AI的贴心脱单小建议|麻辣周报 MOLAR FRESH 2021年第24期 人工智能新鲜趣闻 每周一更新 AI资讯抢先看 2021年8月16日 01 放话挑战GPT-3!以色列推… 2021-08-16 1950 产品 大模型日报(11月13日 学术篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2024-11-13 1400 产品 这三个AI能力被低估了!苹果发布会 苹果发布会相信大家都被新闻轰炸了,细节我就不展开了,我想说三点,甚少有人去展开聊的部分: AI for the rest of us AI on top of the entire… 2024-06-11 2320 产品 初创企业人才、产品组织和业务的三方咬合|真格基金走进华为 11 年间,真格基金陪伴大量初创企业成长,因为业务和团队扩张的需求,很多被投企业都会面临相近的发展问题。为了加强真格被投企业之间关于企业管理和业务合作的进一步交流,真格基金近期在深… 2023-04-14 1340 产品 大模型日报(11月5日 学术篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2024-11-05 900 产品 大模型日报(2月25日 资讯篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2025-02-25 890 产品 眼脑并用!Qwen 开源 QVQ 刷新视觉推理想象力 近两年,大模型的发展从单模态进化到多模态,从基础对话进化到深度推理,AI 正在持续突破人类认知的边界(特别是在 23 年下半年,随着 GPT-4V、Claude-3 等新一代多模态… 2024-12-27 550 产品 真格天使项目「中科睿医」宣布完成数千万元 A+ 轮融资|Z News 更多被投新闻 月之暗面|英雄游戏|边塞科技|右脑科技 瀚为科技|UZIS 有志者|氦星光联|Yahaha 思谋科技|完美日记|井英科技|禾赛科技 优艾智合|零零科技|壹悟科技|怒喵… 2024-12-17 620