必读视频专题飞象趣谈光通信人工智能低空经济5G手机智能汽车智慧城市会展特约记者

声网对话式 AI 引擎2.0 让 AI 更懂开口时机 支持预注册声纹识别与电话外呼

2025年12月10日 17:40CCTIME飞象网

在今年的 RTE2025 实时互联网大会上,声网正式发布了对话式 AI 引擎2.0版本,该版本实现“优雅打断”的升级,支持过滤无语义附和词,让 AI 更懂开口的时机;支持预注册声纹识别,AI 能分辨是谁在讲话;新增电话外呼功能,支持 SIP、PSTN 电话,通过 AI Studio 编排或一行代码即可实现,稳定性高。同时新版本还支持国内外更丰富的 ASR 与 TTS 供应商,用户可根据自己需求选择想要的语种和音色。

对话式 AI 引擎最新产品架构图

优雅打断2.0  让 AI 更懂开口时机

在人与人对话中,经常为了表示认同会发出“嗯”、“啊”、“是的”等常见的语义附和词,但在 AI 对话中,用户并不希望因为自己无意中的一些语义附和词,让 AI 提前响应,这样会给对话体验造成比较割裂的体验感,在教育、会议等很多场景也有很多词需要提前过滤,不需要被 AI 响应。

基于此,对话式 AI 引擎2.0版对“优雅打断”功能进行了升级,不仅支持过滤对话中无语义的附和词,自动识别“嗯”、“啊”等对话附和词,避免误触发响应,还可以过滤自定义的文本,以适应不同业务场景需求。

预注册声纹识别  让 AI 知道是谁在说话

在对话式 AI 中,多人同时与 AI 互动的场景将会越来越多,家居场景中,父母与孩子都会与 AI 互动,孩子不希望聊的内容被爸爸妈妈发现,所以希望 AI 能够区分自己与父母的身份,在和 AI 对话时可以产出不同的内容。

针对这样的需求,声网对话式 AI 引擎2.0 上线了预注册声纹识别,用户仅需4-10秒钟的有效语音注册,可以快速建立声纹模型,对话的过程也是实时进行比对,基本没有任何体感延迟。且整个过程不存储任何声纹数据。通过提前注册不同人的声纹,不仅能让 AI分辨出多说话人声纹,知道是谁在说话。还可以针对不同任务的标签输出不同的对话策略与内容推荐,无论是对于教育、情感陪伴类业务场景还是隐私保护都很有价值。

支持 AI 电话外呼  一行代码即可拨打体验

在“2025对话式 AI 场景热力榜单”中 AI 客服位列Top6.仅次于 AI 语音助手、AI 硬件类热门场景,而 AI 客服场景中电话是核心工具,电话也是目前全球范围内最通用的商业触达用户的接口。对话式 AI 引擎自发布以来,也收到了很多企业用户对 AI 客服场景的需求。

声网一直希望将对话式 AI 能力赋予到电话中,正式在2.0 版本中推出电话外呼功能,支持SIP/PSTN 电话,开发者可以通过声网最新发布的对话式 AI Studio 进行工作流编排,通过 UI 手动配给就可以完成电话拨打,导入号码,审核完成后,直接绑定外呼智能体,再点击拨打。如果想在生产中部署,可以通过一行代码拨打电话,非常便捷,且稳定性可靠。

此外,2.0 版本还接入了国内、海外更丰富的 ASR / TTS 供应商,开发者将拥有更多语种、音色可选择,同时我们也支持第三方自研语音合成的接入,供应商定制、克隆等自定义音色也能上线。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐阅读

精彩视频

精彩专题

关于我们广告报价联系我们隐私声明本站地图

CCTIME飞象网 CopyRight © 2007-2025 By CCTIME.COM

京ICP备08004280号-1 电信与信息服务业务经营许可证080234号 京公网安备110105000771号

公司名称: 北京飞象互动文化传媒有限公司

未经书面许可,禁止转载、摘编、复制、镜像