Meta推出语音生成大模型产品Voicebox,可进行去噪、内容修改、风格转换

Meta推出大模型产品 Voicebox,这是一款语音生成产品。据 Meta 表示,Voicebox 可以合成英语、法语、德语、西班牙语等六种不同语言的语音,除了可以根据文本生成语音内容外,还可以进行去噪、内容修改,风格转换等任务。该模型基于 Flow Matching 技术,可以对扩散模型进行改进。Meta 还比较了 Voicebox 和 Vall-E、YourTTS 等其它音频 AI 模型,表明 Voicebox 更先进,在比较单词错误率和样式相似性时优于两种模型。

论文地址:https://research.facebook.com/publications/voicebox-text-guided-multilingual-universal-speech-generation-at-scale

官方Demo:https://voicebox.metademolab.com

我们将24小时内回复。
取消