Google 文本转语音的轮子 谁搞过?

2018-08-23 19:23:55 +08:00
 JCZ2MkKb5S8ZX9pq

需求

是为了做视频配音。然后一句句去下载很麻烦嘛,就想搞个轮子。
自动识别多行文本,或者 excel,然后每段落单独下载为 mp3,这样比较方便。

方法

目前是直接去摸了 gcloud 官方的 api 啦,传送门:
Quickstart: Using the Client Libraries  |  Cloud Text-to-Speech API  |  Google Cloud

问题

现在全局开着飞机,但跑 sample.py 还是会 504 超时。(访问 google 或 youtube 或 g trans 都 ok 的)
想请问有没有人用过 google 这个接口?

或者有其它轮子也可以推荐一下

7608 次点击
所在节点    Google App Engine
29 条回复
yo0o0o0
2018-08-24 15:43:32 +08:00
我有写好的用 node,调百度的 api。https://github.com/JesseHeisenberg/txtToAudio
jinggoing
2018-08-24 17:16:39 +08:00
没有人用过思必驰的语音吗
fxg
2018-08-24 17:19:08 +08:00
推荐百度,感觉百度的技术和营销部门是完全两个世界
zhchyu999
2018-08-24 17:22:10 +08:00
讯飞是相当贵,自己的模型更贵
est
2018-08-24 17:25:57 +08:00
@ReVanTis 讯飞之前官方不提供 python 离线包,理由是脚本语言可以被反编译。。不知道现在如何了。。
diggerdu
2018-08-25 07:35:07 +08:00
@jinggoing 思必驰技术可以的 交大办的
947211232
2018-08-25 08:39:45 +08:00
#14 不放过一丝汲取知识的机会,为在下打开了新视野。
JCZ2MkKb5S8ZX9pq
2018-08-25 15:25:19 +08:00
@fxg 这个我认同,百度有些计数部门是不错。
之前用 echart 在 github 交流过一阵,还不错的。现在 echart 也还在用,不过也想尝试 d3。
JCZ2MkKb5S8ZX9pq
2018-08-25 15:28:16 +08:00
@est 好像搜到过 py 的离线版,用了在线版主要是考虑效果好一点。
不过对我们短片配音来说,那种拙劣的机器人感,有时候反而效果更好。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/482632

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX