Google 文本转语音的轮子 谁搞过?

2018-08-23 19:23:55 +08:00
 JCZ2MkKb5S8ZX9pq

需求

是为了做视频配音。然后一句句去下载很麻烦嘛,就想搞个轮子。
自动识别多行文本,或者 excel,然后每段落单独下载为 mp3,这样比较方便。

方法

目前是直接去摸了 gcloud 官方的 api 啦,传送门:
Quickstart: Using the Client Libraries  |  Cloud Text-to-Speech API  |  Google Cloud

问题

现在全局开着飞机,但跑 sample.py 还是会 504 超时。(访问 google 或 youtube 或 g trans 都 ok 的)
想请问有没有人用过 google 这个接口?

或者有其它轮子也可以推荐一下

7580 次点击
所在节点    Google App Engine
29 条回复
popbones
2018-08-23 19:46:42 +08:00
Mac OS X 系统自带文本转语音,命令行直接调用 say 命令研究一下
bfpiaoran
2018-08-23 19:47:10 +08:00
直接谷歌翻译不行么。。。。
ReVanTis
2018-08-23 19:50:58 +08:00
以前试过用 google tts 和 yandex 的 tts 做 alexa skill,那时候还不太懂改一些请求的参数,也是发现需要转码率和采样率,最终还是用了讯飞的离线库搞定的。
nuko
2018-08-23 20:01:45 +08:00
我记得讯飞有接口,语音转 TTS 的
JCZ2MkKb5S8ZX9pq
2018-08-23 20:11:17 +08:00
@popbones 嗯,有机会看看。不过这次的最终使用者,用的是 win。
JCZ2MkKb5S8ZX9pq
2018-08-23 20:12:04 +08:00
@ReVanTis @nuko 嗯 我看下讯飞
xubeiyan
2018-08-23 20:47:35 +08:00
tts 很多家都有的啊,百度的也可以啊
JCZ2MkKb5S8ZX9pq
2018-08-23 21:39:44 +08:00
@xubeiyan 百度心理上比较抵触 ( ╯□╰ )
yamedie
2018-08-23 21:49:10 +08:00
百度的 api 比讯飞大方, 普通开发者每日调用限额 20W 次, 对比讯飞的 500 次
ksharp8
2018-08-23 22:48:33 +08:00
可以试用科大讯飞的 api,还支持多种方言
WildCat
2018-08-23 23:02:07 +08:00
我做了百度和腾讯 AI 的封装,最近太忙就没完善。
https://github.com/imWildCat/AITK/blob/master/aitk/cloud/tencent/speech.py#L98

官网: https://aitk.ai

需要的话,我把文档和 pip 发布下。
WildCat
2018-08-23 23:03:07 +08:00
额 百度的封装还没做,今晚搞定。
kimwang
2018-08-24 02:16:58 +08:00
不是 IT 人,不会搞,但对这个非常需要,特别是粤语的,给文化低的老人家读字,听她喜欢的东西。
支持楼主继续搞事情。
JCZ2MkKb5S8ZX9pq
2018-08-24 02:45:38 +08:00
@kimwang 用了讯飞的,有支持粤语。
我是有明确的实际应用,可能并不适合你。
但你可以搜索看看,应该挺多人搞过了。比如我洗澡的时候就会让 safari 读网页听,应该有类似工具吧。
Yvette
2018-08-24 04:55:21 +08:00
say +1
helloiac
2018-08-24 07:24:04 +08:00
fingerprint
2018-08-24 10:39:27 +08:00
讯飞、百度、谷歌都用过。如果是英文转语音建议用谷歌,最好是在国外的 vps 上弄个服务自己用。中文的话讯飞比较好。
JCZ2MkKb5S8ZX9pq
2018-08-24 15:14:44 +08:00
@fingerprint 嗯,讯飞的英语太惨了,日语我都没试出来。
JCZ2MkKb5S8ZX9pq
2018-08-24 15:15:34 +08:00
@helloiac 666 不过我已经搞完了。我们后期还是会自己加剪辑的。
JCZ2MkKb5S8ZX9pq
2018-08-24 15:32:50 +08:00
py3 调用讯飞 tts 的代码,直接 append 分享了。
其中 params 格式化那步有点坑,测了半天才发现是引号和空格的问题,按理说后端应该判断下。
感谢大家的建议。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/482632

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX