剪映的字幕生成用的什么语音识别技术,很快很精确。

288 天前
 azev

还是本地的

736 次点击
所在节点    问与答
1 条回复
tool2d
288 天前
我试了一下 Whisper ,预置模型效果很一般,中英文混合单词基本识别不出来。

效果最好的是天猫精灵的语音识别 API ,手机上最常用的是讯飞语音输入。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/967585

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX