智能体:太好了是语音交互新功能,我们说话有救了! 特工宇宙 • 2024-11-15 19:47 • 产品 • 175 views 你是否经历过,给客服打电话总是遇到让人高血压的 AI? 买的智能音箱对话时总是被错误识别? 以及,最新的 AI 陪伴机器人总是感觉有点呆板? 提效不明显,也提供不了足够的情绪价值… 语音交互体验成为了 AI 落地的一块绊脚石。 而如今扣子推出的技术,有望使这种情况成为过去式。 经过近两年来的发展与验证,大语言模型(LLM)和智能体(Agent)已经逐渐成为行业共识,落地到了生活各处。 AI 游戏陪玩、AI 虚拟陪伴、AI 口语陪练、AI NPC等应用遍地开花,由此也激发了对更优质的 AI 语音交互的强烈需求。 不少产品的语音过于机械,响应速度过慢…这种“对讲机式”的对话,极大的降低了用户体验。 对此,扣子上线了全新的智能语音 OpenAPI,让 AI 从“能说话”到“会说话”。 此前的所有方案,都是在用工程思维处理人文问题。 Google Assistant 虽然能识别几十种语言,却理解不了“中式英语”;Alexa 虽然能控制一整个智能家居,却无法自然地应对打断;Siri 虽然能讲笑话,却始终没有真实的情感温度… 而扣子的方案,首次将“理解”的能力注入了整个语音交互链路。 它不只是在听你说话,而是在理解你说话的场景、语境、甚至情绪。 这让 AI 终于开始像人一样思考和表达。 基于扣子这套“组合拳”做出来的智能体或是 AI 应用,当你跟它交谈时,它不只是在应答,而是在理解、思考、然后用最恰当的方式回应! 这一切的实现归功于以下四个核心突破: 1. 精准语音识别:使用 ASR 语音转成文本,且具备上下文理解能力(比如上文出现过的名词等信息能够在识别中复用,说话等风格和代称也能理解的较好),并对中英混说、噪音、垂直领域等复杂场景识别效果有所提升; 2. 强大的 AI Agent 能力:扣子不只听懂你所说的,更能真正理解你的需求。它拥有 Agent 的各项能力,能够像人一样有记忆力(文件盒子、数据库、变量)、有知识(文本、表格、照片)、有技能(插件、触发器)、还能编排(工作流、图像流)等; 3. 低延迟、可打断:使用了火山引擎 RTC 方案,将链路中的延迟充分降低,并确保即使在弱网络环境下也能通话顺畅。此外,智能体能毫秒级响应用户打断,流畅切换话题并即时反馈,通过火山引擎 RTC 的智能降噪技术,能有效过滤 90% 以上的背景噪音,降低误触发概率,提升对话质量; 4. 自然的语音效果:使用大模型的 TTS 进行文本转语音,根据上下文,智能预测文本的情绪、语调等信息;生成超自然、高保真、个性化的语音,在自然度、音质、韵律、气口、情感、语气词表达等方面更像真人;即使是中英文混说也能行云流水应答自如。 通过将 Agent 的认知能力引入整个语音交互链路,扣子让 AI 首次具备了真正的“对话感”。 以下是实测演示👇 1. Demo 配置流程视频演示。 2. 与智能体实时对话测试。 3. 语音对话过程中,支持实时打断。 4. 轻松完成逼真的音色克隆。 目前该功能还在内测,有相关需求可以在下方链接或点击阅读原文申请。 https://www.coze.cn/survey/7431180581536268314?FG_source=15 回望 AI 发展史,从最初的命令式交互,到基于规则的对话,再到今天的自然语音交流,我们一直在试图跨越人机之间的鸿沟。 扣子的这次突破,终于让AI具备了真正的“理解力”——不是简单的听和说,而是像人一样思考、表达与回应。 这绝对不是简单的功能叠加,而是交互范式的革新,是智能体走向真正智能的关键一步。 原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2024/11/21699.html Like (0) 0 Generate poster 关于作者 特工宇宙 大模型日报(11月15日 学术篇) Previous 2024-11-15 19:23 糟糕!我被 AI 电影包围了! Next 2024-11-16 17:49 相关推荐 产品 最高25000美元云资源!AI 超新星计划开启|Z Events 推荐阅读 2023-08-01 1310 产品 浙江大学DeepSeek公开课第二期: 揭秘智能演变, 人机协作, 产业现状和教育成长(附完整PPT课件) 浙江大学DeepSeek公开课第二期: 揭秘智能演变, 人机协作, 产业现状和教育成长四大主题。全程深入浅出,非常值得一探究竟! 作为人工智能的研究和实践者,在整堂课听完后,也再次… 2025-02-24 760 产品 大模型日报(2月27日 学术篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2025-02-27 470 产品 首发丨Kimi 官方插件第一手测评!极度丝滑! Kimi 是我很早就被圈粉的一个 AI 产品,半个月前去了趟北京,怀着激动的心情,顺道也去 Kimi 参观了一下。 出乎意料的是,这样一家估值约 30 亿美金的 AI 独角兽,竟挤… 2024-07-08 1.0K0 产品 MolarData| AI领域资讯速递 MOLAR NEWS 2020年第25期 MolarData人工智能每周见闻分享,每周一更新。 初音未来十三年,虚拟偶像站上风口 利用数字复制技术构建形象,并通过动作捕捉和3D… 2020-08-10 1770 产品 整数有约 | 光彻科技:AI智能体测系统,体育老师的减负神器,来了! 如果有这样一款机器,能在没有老师监考的情况下,公平公正客观的测出一个班所有人的体育成绩,你能否想象出它是什么样子?它需要用到哪些技术来完成?它能帮体育老师完成哪些事情?它对中国的健… 2022-12-13 1530 产品 别再学那破提示词技巧了! 内容丨特工鲸鱼 审核丨特工少女 当你点进这个标题时内心是怎样复杂的心情,质疑,鄙夷,或者是惊讶?这也正是我们最初点开这篇论文时的心情。 然而, 在完成项目测试后, 我们瘫坐在椅子上… 2025-02-17 1080 产品 全球最大参数的 AI 原生 3D 生成团队,竟悄咪咪上线了 toC 产品! 前段时间参加活动,发现了一个不太一样的巧克力 3D 打印机。 它支持我用自然语言去生成 3D 模型,DIY 出自己想要的。 比如一只小海狸,一只皮卡丘,甚至是…一坨粑粑… 2024-09-23 1590 产品 DeepSeek和ChatGPT在学术研究哪家强(一) DeepSeek横空出世,那么,DeepSeek和ChatGPT在学术研究上哪家强? 抱歉沉寂了近一年之久,直到DeepSeek横空出世,因为产品诞生于杭州,又对硬件算力的突围而出… 2025-01-27 1250 产品 真格天使项目「妙盈科技」宣布完成最新一轮融资|Z News 更多被投新闻 依图科技 | Momenta | Nuro | 云天励飞 禾赛科技 | 晶泰科技&nb… 2024-02-02 1560