大型记录片之《没人比你更懂 AI 配音》!
导读

1、项目清单
语音生成 - 详细 |
|
---|---|
简介 | |
行业标杆,AI 配音主力工具,生成效果自然,可自定义音色。 | |
行业标杆,AI 配音主力工具,生成效果自然,音色库多种多样。 | |
支持多种语言,生成效果自然,但音色库较少。 | |
OpenAI 推出的 TTS 应用,不开源,使用需要收费。 | |
国外知名 TTS 应用,支持多种语言,但生成的中文语音效果不太自然。 | |
简介 | |
最早的 TTS 开源大模型,能生成真人语气语调,但缺少中文语音库。 | |
10 万小时的中英文数据,专为对话场景设计的 TTS 模型。 | |
字节跳动推出的 TTS 模型,演示效果极佳,但目前只发了论文。 | |
阿里推出的开源 TTS 模型,支持多种音色,生成速度飞快。 | |
清华大学推出的 TTS 模型,支持多国语言,特点是推理非常快。 | |
香港科技大学出品,效果自然可控,且支持低配电脑 CPU 推理。 | |
30 万小时的中英日文数据训练,生成和克隆效果都非常好。 |
微软语音 TTS - 详细 |
|
---|---|
简介 | |
免费,可将 Edge TTS 移植到所有浏览器。 |
|
免费,在线免费使用 Edge 浏览器的 TTS 功能。 | |
免费,在线免费使用 Edge 浏览器的 TTS 功能。 | |
简介 | |
免费,微软官方在线视频剪辑应用,可用最新的 TTS 技术。👍 | |
免费,可生成 10000 字,支持多种设置。👍 | |
免费,可生成 10000 字,支持多种设置。👍 | |
免费,可生成 10000 字,支持多种设置。👍 | |
免费,可生成 10000 字,支持多种设置,需要输入验证码。 | |
免费,可生成 10000 字,支持多种设置,需要输入验证码。 | |
免费,单日免费 1000 字符,可通过修改 Header Editor 重置。 | |
免费,支持多种设置,支持多家 TTS 引擎。 |
微软 TTS 音色 - 详细 |
|
---|---|
简介 | |
年轻女声,微软女声主力语音。 | |
知性女声,微软女声主力语音。 口头禅:注意哈。 | |
年轻男声,微软男声主力语音。口头禅:这个男人叫小帅。 | |
冷酷大叔,沉默冷静的大叔噪音。 | |
成年男声,大型纪录片之五星上将专门配音。 | |
一分钟教会你如何制作《大型纪录片》 | |
如何制作一部在自己婚礼上播放的大型纪录片 |
抖音 TTS - 详细 |
|
---|---|
简介 | |
小姐姐 | 相当于微软 TTS 里的“晓晓”。优秀案例:梗指南。 |
知性女声 | 今日话题女配音。 |
亲切女声 | 今日话题女配音。 |
淑女晓晓 | 相当于微软 TTS 里的“晓晓”。 |
晓辰学姐 | 相当于微软 TTS 里的“晓辰”。 |
娱乐扒妹 | 娱乐八卦女配音。 |
娱乐播报 | 娱乐八卦女配音。优秀案例:熊猫博主瓜妹 |
简介 | |
译制版男 | 优秀案例:今日话题酱。[ 制作教程 ] |
新闻男声 | 优秀案例:世界美食official、公孙雅量。 |
雅痞大叔 | 优秀案例:卢诗翰 |
少年云希 | 相当于微软 TTS 里的“云希”。 |
云泽大叔 | 相当于微软 TTS 里的“云泽”。 |
云野说书 | 相当于微软 TTS 里的“云野”。 |
厚实男声 | 湖南卫视男声广告。 |
知识讲解 | 科普博主。 |
科技博主 | 科技博主。 |
小孩 | 宝宝肚肚打雷啦,叮咚鸡专用配音。优秀案例 |
萌娃 | 萌妹配音。 |
咆哮哥 | 咆哮式发言。 |
东北老铁 | 东北话。 |
熊二 | 熊出没熊二 |
懒小羊 | 懒羊羊 |
野原小新 | 蜡笔小新 |
萌萌小龙 | 奶龙 |
下载:剪映 6.0.1 绿色便携版 |
文字转语音,TTS(Text-To-Speech)
现在,文字转语音的应用五花八门,甚至已经是“烂大街”,而且它的应用场景还在不断扩大。
2.1、商用 TTS
目前,文字转语音的方法分成了两派,一派是使用商用语音引擎,另一派是开源语音大模型。
商用语音引擎的技术很成熟,生成效果也最自然,这也是它们敢收费的原因。
这样的引擎很多,但最为知名的还得是 微软语音 和 抖音语音。
网上大多数的 AI 配音,也都出自这两家。
2.2、开源 TTS
另一派是开源语音大模型。
它们开源免费,但需要在本地部署,有一定的上手门槛。
比如最早的开源模型 Bark,一度声名大噪的 ChatTTS,还有最近的 Fish Audio。
但是,由于训练库的原因,这些大模型在生成中文语音时,会有一种“外国人说中文”的感觉。
类似“微信转帐三百块”的歪果人口音,生成的“中文语音”效果不是很理想。
所以,这些大模型通常会用来“语音克隆”。
2.3、TTS 总结
下面是常见的语音生成 TTS 工具,包括商用 TTS 和 开源 TTS。
语音生成 - 详细 |
|
---|---|
简介 | |
行业标杆,AI 配音主力工具,生成效果自然,可自定义音色。 | |
行业标杆,AI 配音主力工具,生成效果自然,音色库多种多样。 | |
支持多种语言,生成效果自然,但音色库较少。 | |
OpenAI 推出的 TTS 应用,不开源,使用需要收费。 | |
国外知名 TTS 应用,支持多种语言,但生成的中文语音效果不太自然。 | |
简介 | |
最早的 TTS 开源大模型,能生成真人语气语调,但缺少中文语音库。 | |
10 万小时的中英文数据,专为对话场景设计的 TTS 模型。 | |
字节跳动推出的 TTS 模型,演示效果极佳,但目前只发了论文。 | |
阿里推出的开源 TTS 模型,支持多种音色,生成速度飞快。 | |
清华大学推出的 TTS 模型,支持多国语言,特点是推理非常快。 | |
香港科技大学出品,效果自然可控,且支持低配电脑 CPU 推理。 | |
30 万小时的中英日文数据训练,生成和克隆效果都非常好。 |
就生成效果来说,微软 TTS 毫无疑问是业界第一,合成效果自然,且能同时支持多国语言。
3.1、微软语音
微软 TTS 有两个版本,一个是 Edge TTS,一个是 Azure TTS。
Edge TTS 就是 Edge 浏览器自带的语音朗读工具,可以免费使用,但支持的音色较少。
好用的音色就 “晓晓,云希”。
Azure TTS 则是微软 TTS 技术的完全体,可以使用所有音色库。
比如广受欢迎的「大型记录片」专用配音“云泽”,就需要用 Azure TTS 才有。
而且支持 SSML 语法,可以自定义语音的风格、语速、语调、多情感表达,还有角色扮演。
3.2、生成工具
Azure TTS 可以在微软自家的 Azure 云服务器 上可以使用,但国内用户无法直接使用。
一个平替方案,是使用微软自家的 ClipChamp 在线视频剪辑应用。
除此之外,则可以使用第三方网站提供的合成服务了。
微软语音 TTS - 详细 |
|
---|---|
简介 | |
免费,可将 Edge TTS 移植到所有浏览器。 |
|
免费,在线免费使用 Edge 浏览器的 TTS 功能。 | |
免费,在线免费使用 Edge 浏览器的 TTS 功能。 | |
简介 | |
免费,微软官方在线视频剪辑应用,可用最新的 TTS 技术。👍 | |
免费,可生成 10000 字,支持多种设置。👍 | |
免费,可生成 10000 字,支持多种设置。👍 | |
免费,可生成 10000 字,支持多种设置。👍 | |
免费,可生成 10000 字,支持多种设置,需要输入验证码。 | |
免费,可生成 10000 字,支持多种设置,需要输入验证码。 | |
免费,单日免费 1000 字符,可通过修改 Header Editor 重置。 | |
免费,支持多种设置,支持多家 TTS 引擎。 |
3.3、优秀案例
选择合适的音色,是 AI 配音至关重要的一步,下面是一些微软 TTS 音色的优秀使用案例。
微软 TTS 音色 - 详细 |
|
---|---|
简介 | |
年轻女声,微软女声主力语音。 | |
知性女声,微软女声主力语音。 口头禅:注意哈。 | |
年轻男声,微软男声主力语音。口头禅:这个男人叫小帅。 | |
冷酷大叔,沉默冷静的大叔噪音。 | |
成年男声,大型纪录片之五星上将专门配音。 | |
一分钟教会你如何制作《大型纪录片》 | |
如何制作一部在自己婚礼上播放的大型纪录片 |
相比之下,抖音语音则是最受欢迎的中文 TTS 生成工具,尤其是它拥有极奇丰富的音色库。
4.1、抖音语音
抖音 TTS,一度是国内最好用的语音合成工具,无论是音色库的数量,还有生成效果之自然。
而且还上线了风格自定义功能,对标 微软 TTS,更重要的是,它可以免费使用。
至到 6.0 版本后,才开始区分 免费版 和 VIP 版。
4.2、生成工具
剪映 VIP 可以解锁所有的人物音色,这里有一个“白票小技巧”。
就是剪映生成的语音文件,会暂时保存在“缓存文件夹”下,只需要打开下面指定的文件夹。
复制生成的 .wav 文件,即可“免费”下载。
Windows 目录:
C:\Users\你的用户名\AppData\Local\JianyingPro\User Data\Projects\com.lveditor.draft\项目名\textReading
MacOS 目录:
/Users/你的用户名/Movies/JianyinPro/User Data/Projects/com.lveditor.draft/项目名/textReading
又或者,网上还有一个剪映 6.0.1 绿色便携版,这个版本可以“免费”使用所有 VIP 语音功能。
至于 Mac 版本,剪映 Windows 和 Mac 版本的“工程文件”是相通的。
直接复制就可以转移。
下载地址:https://share.feijipan.com/s/CGHgxLXq
4.3、优秀案例
抖音 TTS 的音色库选择超过 100 多个,下面是一些抖音 TTS 音色的优秀使用案例。
抖音 TTS - 详细 |
|
---|---|
简介 | |
小姐姐 | 相当于微软 TTS 里的“晓晓”。优秀案例:梗指南。 |
知性女声 | 今日话题女配音。 |
亲切女声 | 今日话题女配音。 |
淑女晓晓 | 相当于微软 TTS 里的“晓晓”。 |
晓辰学姐 | 相当于微软 TTS 里的“晓辰”。 |
娱乐扒妹 | 娱乐八卦女配音。 |
娱乐播报 | 娱乐八卦女配音。优秀案例:熊猫博主瓜妹 |
简介 | |
译制版男 | 优秀案例:今日话题酱。[ 制作教程 ] |
新闻男声 | 优秀案例:世界美食official、公孙雅量。 |
雅痞大叔 | 优秀案例:卢诗翰 |
少年云希 | 相当于微软 TTS 里的“云希”。 |
云泽大叔 | 相当于微软 TTS 里的“云泽”。 |
云野说书 | 相当于微软 TTS 里的“云野”。 |
厚实男声 | 湖南卫视男声广告。 |
知识讲解 | 科普博主。 |
科技博主 | 科技博主。 |
小孩 | 宝宝肚肚打雷啦,叮咚鸡专用配音。优秀案例 |
萌娃 | 萌妹配音。 |
咆哮哥 | 咆哮式发言。 |
东北老铁 | 东北话。 |
熊二 | 熊出没熊二 |
懒小羊 | 懒羊羊 |
野原小新 | 蜡笔小新 |
萌萌小龙 | 奶龙 |
下载:剪映 6.0.1 绿色便携版 |
4.4、未知音色
下面是一些未知的配音音色,欢迎提供反馈,又或者询问你想知道的 AI 配音音色。
1、熊猫博主瓜妹:这个配音像“娱乐扒妹”,但又不确定具体是那个?
2、印度司机丧彪:这个配音经常见,有点东北口音的感觉。
最后
- 欢迎关注奶酪 公众号 获取奶酪所有的原创资源,回复文章编号,比如 i01 就可获取对应的资源。
- 欢迎订阅我的 “奶酪书签专业版”,15年沉淀,超过 5000 个分类井条有序的好用实用 html 网站书签。
- 本文由「奔跑中的奶酪」原创创作,欢迎订阅、留言和 打赏,也欢迎引用和转载,但要注明出处。
有其他网盘吗?小飞机转存不了