有没有这种软件,读取系统播放的英文人声,进行 speech2text 处理,输出文字

2022-04-04 19:17:26 +08:00
 nowheretoseek

搜到的都是接收麦克风输入或者一个音频文件,有没有将系统播放的音频作为输入的呢,比如听 podcast 时,如果能实时进行 speech2text ,感觉挺有用的。 最好是离线引擎,在线的一个是慢,再就是估计费钱。

要能调用 windows 自带的引擎最好了。

830 次点击
所在节点    问与答
3 条回复
Privileges
2022-04-04 19:27:32 +08:00
chrome 的实时转录?识别速度和准确率都挺高,但貌似并没有提供调用 API 。当然有钱的话直接调用讯飞和谷歌的接口就行了。。。
zzgo88
2022-04-04 20:35:16 +08:00
nowheretoseek
2022-04-04 20:44:30 +08:00
@zzgo88 谢谢,我找找看有没有适用 windows 的同类方案

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/844923

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX