来源:IT之家 · 科技 · 东亚 · 05-07 17:19

小米开源 OmniVoice 多语言语音克隆 TTS,支持 600 余种语言

原标题:小米开源 OmniVoice 多语言语音克隆 TTS,号称一个模型搞定 600 余种语言

阅读原文 →

AI 情报摘要

小米开源 OmniVoice,试图用单一语音克隆 TTS 模型覆盖 600 多种语言和低资源语种场景。

关键点

  • OmniVoice 由小米 AI 实验室新一代 Kaldi 团队推出,定位为多语言语音克隆 TTS 模型。
  • 官方称该模型在中英文语音合成场景表现领先,并在多语言任务中具备较强竞争力。
  • 模型重点覆盖低资源小语种,号称支持 600 余种语言,有助于降低多语种语音应用开发门槛。

影响分析

若开源效果符合预期,OmniVoice 将提升小米在语音 AI 与多语言 TTS 生态中的影响力,并推动低资源语种语音技术普及。

情绪:利好 · 相关:小米 / 小米 AI 实验室 / Kaldi 团队 / OmniVoice / 中国 / 东亚 · LLM 已生成

小米 AI 实验室新一代 Kaldi 团队发布并开源 OmniVoice 多语言语音克隆 TTS 模型,称其在中英文场景达到领先水平,并在多语言任务中超越部分商用系统。该模型主打低资源小语种泛化能力,覆盖 600 余种语言。

阅读原文 →