[分享] 一款高效的音频/视频转文字工具——语音识别生成字幕

以下内容由 chatgpt 撰写

大家好，我在这里分享一个我最近发现（ gang bian de ）的非常实用的工具——音频 /视频转文字工具。

这个工具可以帮助你把音频或者视频文件转化为文本，是非常好用的语音识别工具。最令人振奋的是，它不仅可以自动识别语言，而且可以生成多种格式的字幕文本。

主页： https://whisper.myfastools.com/

功能介绍：

音频转文字
识别语言
生成多种格式的字幕文本（ TXT 、SRT 、JSON 、TSV 、VTT ）
使用流程：

上传你的音频或者视频文件，系统会生成一个提取码显示在网页上，你可以用这个提取码来提取你的识别结果。识别结果包含了多种格式的字幕文本。

这是一段以英语演讲识别样例：

[点击这里下载 TXT 格式的结果文件]

https://whisper.myfastools.com/results/db5a4cf3943bb6df8fb6b0eeae5413ac.txt
https://whisper.myfastools.com/results/db5a4cf3943bb6df8fb6b0eeae5413ac.srt
https://whisper.myfastools.com/results/db5a4cf3943bb6df8fb6b0eeae5413ac.json
https://whisper.myfastools.com/results/db5a4cf3943bb6df8fb6b0eeae5413ac.tsv
https://whisper.myfastools.com/results/db5a4cf3943bb6df8fb6b0eeae5413ac.vtt
替换后缀即可下载（ TXT 、SRT 、JSON 、TSV 、VTT ）中的其他格式

希望这个工具对大家有所帮助。如果在使用过程中遇到问题，或者有什么改进的意见，都欢迎在下面留言。我会及时进行回复和改进。期待你们的反馈！

TODO：修改 UI ，添加登录功能，添加使用 GPU 的工作节点，显示实时进度，显示列队

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/944038