业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型，3 秒音频即可克隆音色

# 业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型，3 秒音频即可克隆音色

Source: IT之家（RSS） | Published: 2026-06-23

Summary

网易有道推出"子曰 4.0"TTS 引擎 Confucius4-TTS，声称是业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。用户仅需 3 秒音频即可实现零样本音色克隆，克隆音色与原声相似度超 85%，任务准确度达 97%。模型支持中文、英语等 14 种语言，首创音频 Prompt 情感克隆迁移。底层采用 GPT 式语义大模型、SSL 预训练特征与 ECAPA-TDNN 说话人编码器、Flow Matching 框架。已全量开源（Apache 协议），提供 54GB 资源包供本地部署

Details

14 语种跨语种无口音语音克隆开源模型

这个工具是什么？

网易有道推出"子曰 4.0"TTS 引擎 Confucius4-TTS，声称是业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的代码公开可免费使用模型。用户仅需 3 秒音频即可实现零样本音色克隆，克隆音色与原声相似度超 85%，任务准确度达 97%。模型支持中文、英语等 14 种语言，首创音频给AI的指令情感克隆迁移。底层采用 GPT 式语义AI模型、SSL 基础学习阶段特征与 ECAPA-TDNN 说话人编码器、Flow Matching 框架。已全量代码公开可免费使用（Apache 协议），提供 54GB 资源包供本地部署

能帮你做什么？

这个工具可以帮你：

1. 提升工作效率

2. 自动化重复任务

3. 获得更好的AI体验

适合谁用？

✅ 适合：想要提升效率的普通用户
✅ 适合：对AI感兴趣的新手
❌ 不适合：需要高度定制化的专业用户

总结

这是一个值得尝试的AI工具。如果你想要...，它会是一个不错的选择。

---

数据来源：IT之家（RSS） | 更新时间：2026/6/25

---

**Related Links**

Original: https://www.ithome.com/0/967/636.htm