求推荐一个中文语音克隆项目?

2023-05-19 13:47:27 +08:00
 Cormic
之前买过一个科大讯飞的玩具,就是父母按照指定文本录制一些语音,就可以合成一个克隆的语音,用这个语音给小孩子读书讲故事。

看了下比较火的 coqui.ai ,好像这个不支持中文,他们开发团队里也没人懂中文,而且他们官方的 demo 里似乎也没有支持中文语音克隆。

大家有什么推荐的项目吗?最好是可以完全本地化搭建和训练的,谢谢!
1420 次点击
所在节点    问与答
4 条回复
findex
2023-05-20 02:44:22 +08:00
同求
wkla
2023-05-20 06:22:02 +08:00
百度飞桨的项目,TTS+音色克隆。开源,应该可以本地部署。中文支持。
https://aistudio.baidu.com/aistudio/projectdetail/5003396?channelType=0&channel=0

VITS 音色克隆,TTS+音色克隆,开源,应该可以本地部署。中日都行。可以在下面的网站里试试效果。
https://huggingface.co/spaces/zomehwh/vits-models

so-vits-svc 音色克隆,将一段音频转化为另一种音色,非实时。开源,可以本地部署。用来做歌声音色克隆的效果不错。下面是 Github 链接。b 站可以搜到大量的效果展示和教程。
https://github.com/svc-develop-team/so-vits-svc

RVC ,实时变声器,开源,可本地部署。下面分别是 github 链接和 b 站介绍视频。
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
https://www.bilibili.com/video/BV1pm4y1z7Gm/
buyno1
66 天前
@wkla github 那些开源的 能不能直接免费在飞浆里部署,colab 实在不行,分分钟就断掉,根本不实用
wkla
66 天前
@buyno1 现在 TTS 推荐 GPT-SoVITS ,只用比较少的样本 TTS 音色还原就不错了。本地 4G 以上显存应该就能跑。https://github.com/RVC-Boss/GPT-SoVITS

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/941243

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX