网易有道发布TTS语音合成引擎Confucius4-TTS：3秒音频素材即可语音克隆--快科技--科技改变未来

正文内容 评论（0）

网易有道发布TTS语音合成引擎Confucius4-TTS：3秒音频素材即可语音克隆

2026-06-23 17:26:50 出处：快科技作者：鹿角编辑：鹿角评论(0)

复制

纠错

#网易有道 #语音

快科技6月23日消息，据媒体报道，网易有道近日正式发布“子曰4.0”TTS语音合成引擎——Confucius4-TTS，这是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。

该模型在跨语种语音克隆、免参考文本建模、情感韵律迁移及本地化部署等关键维度上均达到国际前沿水平，为多语种内容生成、数字人配音、跨语言教学、短剧出海及全球化传播提供了低门槛、国产化的技术底座。

目前，Confucius4-TTS已全面覆盖中文、英语、西班牙语、法语、德语、韩语、泰语、越南语等14种语言的自然流利表达。

用户仅需提供3秒音频素材，无需参考文本或前期训练，模型即可完成音色克隆，相似度超过85%，克隆任务准确度达到97%。

输入中文音频后，模型能够使用原声音色输出多语种语音，并在全过程中保持音色高度一致；同时，模型可自动提取参考音频中的情感特征，实现语调、韵律与情绪的完整迁移。

在底层架构上，Confucius4-TTS引入GPT式语义大模型作为主干，搭配可学习说话人编码器，并采用Flow Matching流匹配生成框架，不再沿用传统的声码器方案，显著提升了生成质量与可控性。

值得关注的是，网易有道已将Confucius4-TTS全量开源，采用Apache开源协议，面向全球开发者开放完整模型权重及配套工具链，商用无限制。开发者可下载54GB完整资源包，进行本地离线部署，满足数据安全与定制化需求。

GitHub开源地址：https://github.com/netease-youdao/Confucius4-TTS

【本文结束】如需转载请务必注明出处：快科技

责任编辑：鹿角

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#网易有道 #语音 #AI

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波