业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型,3 秒音频即可克隆音色
# 业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型,3 秒音频即可克隆音色
Source: IT之家(RSS) | Published: 2026-06-23
Summary
网易有道推出"子曰 4.0"TTS 引擎 Confucius4-TTS,声称是业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。用户仅需 3 秒音频即可实现零样本音色克隆,克隆音色与原声相似度超 85%,任务准确度达 97%。模型支持中文、英语等 14 种语言,首创音频 Prompt 情感克隆迁移。底层采用 GPT 式语义大模型、SSL 预训练特征与 ECAPA-TDNN 说话人编码器、Flow Matching 框架。已全量开源(Apache 协议),提供 54GB 资源包供本地部署
Details
14 语种跨语种无口音语音克隆开源模型
这个工具是什么?
网易有道推出"子曰 4.0"TTS 引擎 Confucius4-TTS,声称是业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的代码公开可免费使用模型。用户仅需 3 秒音频即可实现零样本音色克隆,克隆音色与原声相似度超 85%,任务准确度达 97%。模型支持中文、英语等 14 种语言,首创音频 给AI的指令 情感克隆迁移。底层采用 GPT 式语义AI模型、SSL 基础学习阶段特征与 ECAPA-TDNN 说话人编码器、Flow Matching 框架。已全量代码公开可免费使用(Apache 协议),提供 54GB 资源包供本地部署
能帮你做什么?
这个工具可以帮你:
1. 提升工作效率
2. 自动化重复任务
3. 获得更好的AI体验
适合谁用?
- ✅ 适合:想要提升效率的普通用户
- ✅ 适合:对AI感兴趣的新手
- ❌ 不适合:需要高度定制化的专业用户
总结
这是一个值得尝试的AI工具。如果你想要...,它会是一个不错的选择。
---
数据来源:IT之家(RSS) | 更新时间:2026/6/25
---
**Related Links**
- Original: https://www.ithome.com/0/967/636.htm
Source: IT之家(RSS)