OpenAI开发双向语音模型：被打断也能秒回让通话更自然顺畅--快科技--科技改变未来

正文内容 评论（0）

OpenAI开发双向语音模型：被打断也能秒回让通话更自然顺畅

2026-03-07 00:50:05 出处：快科技作者：鹿角编辑：鹿角评论(0)

复制

纠错

#OpenAI #大模型

快科技3月7日消息，据媒体报道，OpenAI正在研发一种全新的语音模型，旨在让用户与ChatGPT的对话更加自然流畅。这项技术的核心突破在于，当用户在AI说话过程中打断系统时，AI能够实时调整回应，而不是像现在这样突然停止。

目前ChatGPT的高级语音模式采用的是回合式对话机制，用户必须先说完话，AI才会处理语音并生成回答。如果用户在AI发言时插入"okay"或"mm-hm"等简短回应，系统通常会直接停止，无法像正常对话那样继续推进交流。

为解决这一问题，OpenAI正在开发的BiDi（双向语音模型）能够持续处理说话者的语音输入，因此在被打断时可以立即调整回应。相比之下，现有的语音模型一旦开始生成回答，输出内容就基本固定，无法再根据新的输入进行变化。

这项技术目前仍处于开发阶段。据知情人士透露，原型模型在持续对话几分钟后容易出现故障，有时甚至会发出不自然的声音。OpenAI研究人员原本希望今年第一季度发布BiDi，但目前最新的发布时间可能推迟到第二季度或更晚。

OpenAI认为，如果语音模型能够在性能上接近文本模型，AI的使用范围将进一步扩大，因为大多数人更习惯与AI进行语音交流，而不是输入文字。BiDi模型在客服场景中可能尤其有价值。

例如，当顾客与零售商的AI客服通话时，如果顾客在对话过程中临时决定选择换货而非退货，BiDi模型理论上可以让AI客服顺畅调整对话，而不会突然停止或出现混乱。

知情人士还透露，BiDi模型在调用外部工具和应用方面也更灵活。OpenAI此前表示，公司计划为未来一款主要通过语音交互的AI设备改进语音模型，并考虑开发一款智能音箱，通过语音指令即可查看邮件或预订服务。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：鹿角

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#OpenAI #大模型 #开发

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波