有什么开源的语音识别工具

3 天前
 RichardY
whisper 试了很多次,准确性很差。基本上每句话都是错的。一句很短且标准的语音,都能识别错。也不知道是不是我用的不对。

有没有对中文比较友好的开源语音识别工具?
831 次点击
所在节点    问与答
6 条回复
TimePPT
3 天前
拥抱脸上很多呀,找几个支持中文的试试应该能找到
https://huggingface.co/models?pipeline_tag=automatic-speech-recognition&sort=trending
wangxiaodong
3 天前
离线工具的受制于 AI 大模型体量,估计都不怎么样,还得是 Google Gemini 的普通话云端 STT 效果比较好,网上甚至有免费识别声音并直接生成字幕的,你可以试试看:
https://passed.app/main/more/online/speech-to-text/
ejin
2 天前
说到这个来个题外话,腾讯混元(元宝) app 识别率还行,虽然识别中英文混合的容易出错,但是它总是瞎编最后一句话。。。。我每次都眼睁睁看着他瞎编的最后一句话。。。。
woshizhuwow
2 天前
我一直用这个当输入法,用起来感觉效果还蛮不错,可以试试
https://github.com/HaujetZhao/CapsWriter-Offline
avrillavigne
2 天前
用的 faster whisper 吗
Alexf4
2 天前
阿里的几个开源的模型识别的效果还行。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1156427

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX