正文内容 评论(0)
在今年的 RTE2025 实时互联网大会上,声网正式发布了对话式 AI 引擎2.0版本,该版本实现“优雅打断”的升级,支持过滤无语义附和词,让 AI 更懂开口的时机;支持预注册声纹识别,AI 能分辨是谁在讲话;新增电话外呼功能,支持 SIP、PSTN 电话,通过 AI Studio 编排或一行代码即可实现,稳定性高。同时新版本还支持国内外更丰富的 ASR 与 TTS 供应商,用户可根据自己需求选择想要的语种和音色。
![[MD:Title]](http://img1.mydrivers.com/img/20251210/77a38387-4efc-4744-b994-930b0f11479b.jpg)
对话式 AI 引擎最新产品架构图
优雅打断2.0 让 AI 更懂开口时机
在人与人对话中,经常为了表示认同会发出“嗯”、“啊”、“是的”等常见的语义附和词,但在 AI 对话中,用户并不希望因为自己无意中的一些语义附和词,让 AI 提前响应,这样会给对话体验造成比较割裂的体验感,在教育、会议等很多场景也有很多词需要提前过滤,不需要被 AI 响应。
基于此,对话式 AI 引擎2.0版对“优雅打断”功能进行了升级,不仅支持过滤对话中无语义的附和词,自动识别“嗯”、“啊”等对话附和词,避免误触发响应,还可以过滤自定义的文本,以适应不同业务场景需求。
预注册声纹识别 让 AI 知道是谁在说话
在对话式 AI 中,多人同时与 AI 互动的场景将会越来越多,家居场景中,父母与孩子都会与 AI 互动,孩子不希望聊的内容被爸爸妈妈发现,所以希望 AI 能够区分自己与父母的身份,在和 AI 对话时可以产出不同的内容。
针对这样的需求,声网对话式 AI 引擎2.0 上线了预注册声纹识别,用户仅需4-10秒钟的有效语音注册,可以快速建立声纹模型,对话的过程也是实时进行比对,基本没有任何体感延迟。且整个过程不存储任何声纹数据。通过提前注册不同人的声纹,不仅能让 AI分辨出多说话人声纹,知道是谁在说话。还可以针对不同任务的标签输出不同的对话策略与内容推荐,无论是对于教育、情感陪伴类业务场景还是隐私保护都很有价值。
支持 AI 电话外呼 一行代码即可拨打体验
在“2025对话式 AI 场景热力榜单”中 AI 客服位列Top6,仅次于 AI 语音助手、AI 硬件类热门场景,而 AI 客服场景中电话是核心工具,电话也是目前全球范围内最通用的商业触达用户的接口。对话式 AI 引擎自发布以来,也收到了很多企业用户对 AI 客服场景的需求。
声网一直希望将对话式 AI 能力赋予到电话中,正式在2.0 版本中推出电话外呼功能,支持SIP/PSTN 电话,开发者可以通过声网最新发布的对话式 AI Studio 进行工作流编排,通过 UI 手动配给就可以完成电话拨打,导入号码,审核完成后,直接绑定外呼智能体,再点击拨打。如果想在生产中部署,可以通过一行代码拨打电话,非常便捷,且稳定性可靠。
![[MD:Title]](http://img1.mydrivers.com/img/20251210/057bf145-a386-4f8b-90ec-91875d0b2cd5.jpg)
此外,2.0 版本还接入了国内、海外更丰富的 ASR / TTS 供应商,开发者将拥有更多语种、音色可选择,同时我们也支持第三方自研语音合成的接入,供应商定制、克隆等自定义音色也能上线。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...
