标签

网易有道发布子曰4.0引擎:实现14语种无口音语音克隆技术突破

发布时间:2026-06-23 21:32阅读:2

新浪科技讯 6月23日下午消息,近日,网易有道正式推出“子曰4.0”TTS语音合成引擎Confucius4-TTS,这是业界首款支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。该模型在跨语种语音克隆、免参考文本建模、情感韵律迁移和本地化部署等关键维度上达到国际最前沿水平,现已面向全球用户全量开源。

目前,网易有道Confucius4-TTS已全面支持中文、英语、西班牙语等14种语言的自然流利表达。

同时,网易有道Confucius4-TTS实现了三大技术突破:第一,用户仅需提供3秒音频素材,模型即可完成音色克隆。克隆音色与原声相似度超过85%,克隆任务准确度高达97%。第二,支持14种语言无缝切换,消除跨语种口音壁垒。第三,实现情感韵律的无损跨语种迁移,Confucius4-TTS能自动提取、解析参考音频中的情感特征。

据悉,Confucius4-TTS引入了GPT式语义大模型作为主干,搭配基于SSL预训练特征和ECAPA-TDNN的可学习说话人编码器,并采用Flow Matching流匹配生成框架。目前,网易有道已将该模型全量开源。Confucius4-TTS采用Apache开源协议,面向全球开发者开放完整模型权重和配套工具链,商用没有限制。开发者可以下载54G完整资源包,本地离线部署运行。