文章目录[隐藏]
AI语音应该算是AI领域发展最成熟应用之一,几乎每家厂商都提供了AI语音服务,尤其是语音合成(Text To Speech,TTS)已经大量应用于视频配音,大家在各大视频平台看到的电影解说、营销号视频很多都是由TTS完成,今天就来看看目前最流行的AI配音服务都有哪些吧!
[t-success icon='']AI语音合成[/t-success]
一、Microsoft Azure Text-to-Speech
微软旗下的AI语音生成器项目,使用深度神经网络进行训练,以生成非常自然的语音。微软旗下文本转语音的显著特点是其可定制性 - 您可以选择许多语言和口音。这种灵活性可以确保您可以完美地将您的内容与品牌个性和受众相匹配。目前很多营销号和电影解说用的就是此项服务,其中的云希更是大家的老熟人。
地址:https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech
国内外大量的第三方服务都是使用微软的此项服务,像之前介绍的《想要一个AI女友吗?》,目前需要注册Microsoft Azure才可用使用该服务,而注册Azure账号还有一个门槛就是需要验证信用卡,好在有不少免费的第三方服务可以让大家可以体验。
1、浏览器插件「文本转语音」
首先推荐大家使用国人开发的浏览器插件「文本转语音」,目前支持Chrome和EDGE浏览器,支持保存生成的语音。
2、NaturalReader
来自加拿大的NaturalReader就是基于微软文本转语音服务,目前提供在线、浏览器插件与手机APP服务,支持上传TXT、PDF等文档,适合做有声读物、广播剧等长文本配音。
3、Lovo.ai
根据你的用途,为你提供一些参考模板,在模板的基础上进行修改即可生成语音,提供免费试用,可生成20分钟的内容,英语有更多个性的语音可供选择,适合外贸、营销、YouTuber等使用。
4、Ondoku
Ondoku主要是基于微软的服务,也同时提供了亚马逊和谷歌的服务,目前免费用户提供1,000字符每月试用。
二、讯飞配音
科大讯飞是国内在AI语音领域技术龙头之一,其推出的讯飞配音也提供了多种多样的服务,可以根据自己的需求进行选择,但小编想吐槽的是讯飞旗下各平台账号不互通,VIP服务的价格也较高,如果你要长期使用可以去试用下看看效果。
三、TTSMaker
TTSMaker是一款免费的文本转语音在线工具,提供语音合成服务,支持多种语言,包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语、越南语等,以及多种语音风格。您可以用它大声朗读文本和电子书,或下载音频文件用于商业用途(完全免费)。目前免费额度是20000个字符每周。部分声音支持不计入每周限制,可无限制不限量免费使用。
四、各大云主机服务商
各家云主机厂商都推出了语音合成(TTS)服务,微软的其实也属于这类,目前比较有名的还有Google Cloud、Amazon Polly、腾讯云和阿里云等,目前第三方服务用的比较多的是Google Cloud、Amazon Polly、腾讯云,阿里云不支持试用。
1、Google Cloud
谷歌旗下Google Cloud提供的TTS服务目前支持 50 多种语言和语言变体的 380 多种语音,包括中文普通话、印地语、西班牙语、阿拉伯语、俄语等。新用户注册可获得 $300 赠金,用于抵扣 Text-to-Speech 的相关费用。中文语音的效果略显生硬,不太适合用于中文内容制作。
2、Amazon Polly
亚马逊旗下的Polly 使用深度学习技术来合成听起来自然的人类语音,让您可以将文章转换为语音。目前注册用户可以每月免费使用 500 万个字符,为期 12 个月,目前中文仅提供了两个女性的声音(普通话、粤语各一个),效果与Google Cloud也算是半斤八两。
PS:以上两款服务都需要注册才能试用,如果不想注册,可以在Free TTS里体验,目前免费用户一次可输入200个字符进行体验,大家可以去试听一下效果。
3、腾讯云
腾讯云提供的语音合成服务支持多种男声、女声的选择,使得音色能够覆盖多样化的应用场景,适用于电话客服,小说朗读,消息播报等场景,目前已经应用在腾讯智影等服务上。
[t-success icon='']结语[/t-success]
目前提供语音合成服务的厂商非常多,以上也只是用的比较多的一些服务,大家也可以分享自己使用的服务。其实目前AI语音合成的热点已经是克隆自己或者他人的声音,来进行语音阅读、唱歌等,前段时间火爆的AI孙燕姿就是如此,不仅有厂商提供此类服务,还有开源项目(需要显卡支持)。
[t-primary icon='']AI语音[/t-primary]
1、Resemble AI
Resemble AI是AI语音生成领域最具开创性(也是最具争议性)的工具之一。这项技术可以使用一种名为“声音克隆”的工具,模仿不仅是您的声音,还有任何其他声音。由内容创作者和影响者迅速普及,这个工具将远远超越模仿说唱歌手和名人的病毒恶搞,很快可能成为您喜爱的播客背后的声音。
2、Uberduck
Uberduck提供了TTS服务,与上面介绍的基于微软TTS不同的项目不同,Uberduck是使用自己训练的声音模型,目前尚不支持中文,同样提供了“声音克隆”服务。
地址:https://uberduck.ai
3、开源AI语音模型Bark
「Bark」是一个开源模型,可以生成类似真人的多语言语音,还能生成音乐、背景噪音等简单的音效,以及可以根据文字内容生成笑、叹息和哭泣、喘息声、清嗓子等声音。具体介绍《真人语调+多语言+AI 唱歌!开源AI语音模型Bark,让文本生成语音更简单!》
4、So-vits-svc
So-vits-svc(也称Sovits)就是目前最火热的AI语音开源项目,B站上的各种AI孙燕姿都是基于此制作,这由是中国民间歌声合成爱好者Rcell基于VITS、soft-vc、VISinger2等一系列项目开发的一款开源免费AI语音转换软件,现由svc-develop-team接手进行后续维护。So-vits-svc基于端到端架构的VITS和soft-vc,用户只需准备几十分钟到几个小时不等的语音或歌声数据,就能制作(训练)属于自己的AI声库(前提是你的显卡足够给力),将一段语音或歌声转换为你想要的音色。(目前B站上教程非常多)
5、TTS-Vue
TTS-Vue 是一个开源你的微软语音合成项目,采用微软官方语音合成接口,使用WebSocket链接。同时还支持edge朗读,两种接口!支持SSML语音合成标记语言SSML 是一种基于 XML 的标记语言,可让开发人员指定如何使用文本转语音将输入文本转换为合成语音。支持批量转换、支持大文件/长文本切片、支持声音试听