有没有浏览器插件可以把视频教程直接变成文本?

2021-06-09 15:05:33 +08:00
 aeli
感觉看视频教程太占时间,有没有可以直接将视频里的声音通过语音识别直接转成文本的浏览器插件或者工具?
5289 次点击
所在节点    程序员
58 条回复
dewo4e
2021-06-09 16:48:59 +08:00
视频本身提供字幕的话,好解决
像 youtube 大部分视频都可以
到 greasyfork 下个脚本就行了
tangchi695
2021-06-09 16:52:29 +08:00
视频上传油管,生成字幕,下载,完事儿。
tutustream
2021-06-09 16:56:35 +08:00
LZ 这个需求真的可以,不过只靠插件不行。

具体 ls 也说了,就是 2 步,上传油管,下载字幕(有只下载字幕的网站)。
dengji85
2021-06-09 17:14:39 +08:00
提取了正确的文字也没用把,人家教程就是图文合一的
fyxtc
2021-06-09 17:30:09 +08:00
浏览器插件过分了,能读取到 stream 并解析,这和之前 v2 大火的那位提供免广告观看视频有异曲同工之妙。而且语音识别这种工作量你让一个插件跑? 5 分钟的视频让 js 跑个 10 分钟可能还在跑,既侵权+做的事又没意义,楼主就是典型的眼高手低,指点江山。
libook
2021-06-09 17:42:39 +08:00
那种可以用文字简单直接说明白的信息,如果是以视频的形式提供我基本不会看,特别是通勤的时候,听旁白还要找耳机。

视频作为一种媒体形式是可以承载文字难以承载的内容的,比如动画演示和实验实拍,这种得自己能看懂视频的 AI 才能转换成文字描述。

所以现阶段能实现的就是把音频进行语音识别,不过考虑到我关注的视频号都是能充分发挥视频媒体特性的,估计这种功能对我来说没啥用。
yiqiao
2021-06-09 17:43:36 +08:00
方案一:autosub 可以看下。我用过,识别率有点低。
方案二:ffmpeg 转音频后找在线转换的,例如百度,讯飞。网易。我之前用过网易的见外免费的,https://jianwai.youdao.com/index/0
dss886
2021-06-09 18:04:36 +08:00
muzuiget
2021-06-09 18:55:28 +08:00
无非就是语音识别出字幕,只不过不需要时间轴,建议发起幻想,成本不低,所以没人做。
ShareDuck
2021-06-09 19:06:37 +08:00
认同 3 楼的这个观点:“而且我认为不如直接找文本教程,视频教程质量中位数和平均值均较低”。
Youtube 本身就能做到提取整个视频的全部字幕(语音识别),但即使能做到,也达不到楼主的目的。首先,语音识别成文字,肯定存在一定的错误率,尤其是专业词汇,影响理解。第二,大部分视频教程,是语音配合画面的动作来解释的,你单纯看字幕,是无法获取到作者的意思的。
lysS
2021-06-09 19:09:33 +08:00
哟,又有产品来逛 v2 了
jfdnet
2021-06-09 20:40:44 +08:00
视频里面的音频只是做辅助用的,转成文字也没有用。
aeli
2021-06-09 21:02:01 +08:00
@tutustream 并不是,有字幕我直接提取字幕就行,有很多视频是没有字幕的。

@dss886 看介绍这个似乎真的可以,试用一下,多谢。

另外,不明白这种冷嘲热讽,不行你上的风气那里来的,我只是因为一个比较小众的需求来找找现成市场有没有解决方案,这里不讨论深度的东西,就打字嘲讽很有意思?
aeli
2021-06-09 21:06:30 +08:00
@fyxtc 你知道有个词叫 api 嘛?又不是让 js 插件自己去做语音识别。另外可能我标题里只有插件一个词,你就没看看正文里还有“或工具”这个选项?
aeli
2021-06-09 21:07:29 +08:00
@jingslunt 视频流你可以理解为被分割成只包含几 s 缓冲小段小段的视频文件,一般视频网站的下载工具就是下载再格式转换成 mp4 。
directorliu
2021-06-09 22:22:43 +08:00
我用 autosub 加讯飞接口做字幕都想吐,人工校对也有不少工作量
pxmxxp
2021-06-09 22:31:43 +08:00
这个解决方法和自动添加字幕是一个原理,可以参考这个
https://github.com/wxbool/video-srt-windows
janus77
2021-06-09 22:45:30 +08:00
你的视频必须有如下特征
普通话标准
专业术语易于识别
全程语音占的比重大,如果某些台词就是“如下图所示”请问你怎么转
更重要的是,你本来可以直接找一篇相同主题的文章去看的,请给我个理由非要用这个视频转一遍
janus77
2021-06-09 22:46:17 +08:00
@janus77 #38 哦对了,还有中英文混杂、英文简称(伪简称)、校对等工作来做
Rabbircantknow
2021-06-09 22:49:25 +08:00
chrome 在播放声音的时候,右上角的插件栏会有一个像是播放列表的图标,点开之后会有个实时字幕的选项,开启选项后,会出现一个黑色底的窗口,实时的将音频中的话识并展示别出来。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/782409

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX