「视字」小程序:从视频中提取文字

2020-02-17 16:13:06 +08:00
 quietjosen

大家好,我新开发了小程序「视字」,可以 从视频中提取文字,欢迎一试。

「视字」小程序,怎么用?

小程序嘛,打开即用:选择视频,然后等等即可

除了 相册里的视频,还可以选择 聊天对话 中的 视频、以及 音频(比如 mp3/wav 等)

除了 中文,还可以提取 英语

注:不是提取视频截图里的文字,而是视频语音中的文字,也可理解为视频的文案、文稿。

「视字」小程序,有什么用?

恩,灵魂一问。

其实最开始,我是帮一位家人做的。她的需求是这样的:经常需要听一个教学视频,有时还会用手把视频中的要求手抄下来,然后反复看。这个明显就比较费时费力。

于是,我就帮她做了这个工具,可以直接提取视频中的文字,然后在手机上看、或者打印出来看。

做就做了,于是就封装成了产品,说不定会有其他人也需要。

不是有很多类似的产品吗?

首先,其实并不是很多。

音频转文字的不少,但直接从视频到文字的,真的很少。讯飞有一个类似的,针对的是视频加字幕的需求,收费是 0.78 元每分钟。

当然,有能力的小朋友,可以很轻松地从视频中提取音频,然后再使用音频转文字的产品。可,你要知道,很多人的 IT 水平,真的没那么高;他们需要的是 One-Click 产品。

技术方案是怎样的?

其实,我比较了很多的技术方案,也踩过很多坑,目前的方案是:

其实,如果是用本地应用,完全可以用 ffmpeg 实现转码,可以节约转码时间和费用。而我就想做成个小程序,分发确实方便,也只能这样了。

那你怎么赚钱?

从产品的由来,你可以知道我并不是为了赚钱。不过,确实是有技术成本的。小程序里收费比较麻烦,主要是 iOS 对内购的限制。暂时没想法,可能等量上来了,再考虑「看广告、免费使用」之类的策略。

尾巴

我有写博客和公众号的习惯,这篇文章里记录了「视字」小程序的开发过程、踩过的坑,感兴趣可以一看。

https://mp.weixin.qq.com/s/9E7NiNiFQEzKg8VdWC52-w

6099 次点击
所在节点    分享创造
18 条回复
fancy111
2020-02-17 16:23:44 +08:00
这个功能不难,建议加上直接填视频链接解析的。
quietjosen
2020-02-17 16:34:07 +08:00
@fancy111 恩,记在列表里了。不过,暂时没兴趣做。
Kimipoker
2020-02-17 18:04:46 +08:00
挺好用的 谢谢呢
quietjosen
2020-02-17 18:16:30 +08:00
@Kimipoker 不客气,多用多提意见~
mumbler
2020-02-17 18:18:32 +08:00
名字太绕口,建议改成“视文”
quietjosen
2020-02-17 18:32:11 +08:00
@mumbler 恩,明白。
gejun123456
2020-02-18 03:39:17 +08:00
可以弄个直接生成字幕的功能 用处挺大的
rekulas
2020-02-18 09:41:11 +08:00
我觉得言文 视文都可以
quietjosen
2020-02-18 10:42:59 +08:00
@gejun123456 恩,我也感觉是字幕是比较常见的需求。有一些类似的产品,比如讯飞,以及抖音快手的编辑器。
quietjosen
2020-02-18 10:43:31 +08:00
@rekulas 文言文即视感 😂
waytocode
2020-02-18 11:03:24 +08:00
youtube 这个功能做得还蛮强大的
kevtyle
2020-02-18 11:26:02 +08:00
只在小程序使用有点不方便,要是有网页版就好
quietjosen
2020-02-18 11:26:40 +08:00
@waytocode 对,借道 YouTube,是可以实现类似的功能。不过,就是导出、后处理,对一般人稍稍有点麻烦。更别说,绝大多数人,是无法访问这个神奇的网站的。
quietjosen
2020-02-18 11:27:09 +08:00
@kevtyle 小程序分发成本低,就先拿来做。如果用户量大,可以考虑更适合的产品形态。
guozhaoti
2020-02-18 18:40:26 +08:00
理想中这样的功能应该是能弹个浮窗,实时捕获其他应用的音频流然后转化成文字,你这样的小程序需要把视频音频下载到本地然后在上传转换,不够强大,大兄弟继续努力
quietjosen
2020-02-18 19:13:03 +08:00
@guozhaoti 可以录屏后识别。实时的,可以了解我的「说字」
enderftt
2020-02-18 22:49:18 +08:00
试试看
codehz
2020-02-23 19:30:00 +08:00
@guozhaoti 谷歌给自家的 Pixel 的 android10 已经上线了这个功能了,(虽然只有英文),对任意视频都可以用,除了音乐的识别效果略差(

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/645266

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX