来源:IT之家 · 科技 · 东亚 · 05-07 17:19
小米开源 OmniVoice 多语言语音克隆 TTS,支持 600 余种语言
原标题:小米开源 OmniVoice 多语言语音克隆 TTS,号称一个模型搞定 600 余种语言
AI 情报摘要
小米开源 OmniVoice,试图用单一语音克隆 TTS 模型覆盖 600 多种语言和低资源语种场景。
关键点
- OmniVoice 由小米 AI 实验室新一代 Kaldi 团队推出,定位为多语言语音克隆 TTS 模型。
- 官方称该模型在中英文语音合成场景表现领先,并在多语言任务中具备较强竞争力。
- 模型重点覆盖低资源小语种,号称支持 600 余种语言,有助于降低多语种语音应用开发门槛。
影响分析
若开源效果符合预期,OmniVoice 将提升小米在语音 AI 与多语言 TTS 生态中的影响力,并推动低资源语种语音技术普及。
情绪:利好 · 相关:小米 / 小米 AI 实验室 / Kaldi 团队 / OmniVoice / 中国 / 东亚 · LLM 已生成
小米 AI 实验室新一代 Kaldi 团队发布并开源 OmniVoice 多语言语音克隆 TTS 模型,称其在中英文场景达到领先水平,并在多语言任务中超越部分商用系统。该模型主打低资源小语种泛化能力,覆盖 600 余种语言。