有哪些方式可以解析 B 站、抖音的视频的文本?

19 小时 15 分钟前
 Zizpop
刷视频的时候经常听到一些醍醐灌顶的观点,但是视频收藏起来之后就很难找到、或者说索引出来。

要是能解析成文本保存到笔记中就好了。

V 友们,知道有什么效率高、成本低的方案吗?
1288 次点击
所在节点    程序员
11 条回复
BlueBing
18 小时 36 分钟前
你问下 ai ,它会帮你安装音频转文字,再帮你提炼。
豆包也可以提炼抖音视频的内容
Mzs
18 小时 34 分钟前
ooooo00000ooooo
17 小时 26 分钟前
yt-dlp 下载音频, 本地大模型 ASR 转文字。
RW5kZXJBdmFyaXRp
15 小时 50 分钟前
用 wispher 模型转换一下?
pakro888
15 小时 36 分钟前
抖音可用豆包

longlonglanguage
15 小时 14 分钟前
这么巧,今天刚发现了一个,https://github.com/moonjoin/tampermonkey-scripts 。这个作者写了三个插件,一个是 bilibili 总结,一个是网页总结,另一个可以把总结内容加入到某笔记的插件。需要自己添加 ai 的 key ,不过在作者的 github 最下方有推荐,小米的 ai 有推广活动,填写作者的推荐码,可以获得 10 元的体验。我就不厚脸皮发我的推荐码了,建议填一下作者的算是对作者的支持了。
Vinceli2401
15 小时 3 分钟前
yt-dlp + whisper + 随便找个 LLM 总结 自己写个脚本感觉不会很难
AastroLula
14 小时 13 分钟前
如果大部分的内容都是文字稿转视频配上动画的,确实语音转文字是个不错的省流方案,要是配合本地语音模型加上 llm 感觉是个不错的方案,先 mark 回头手搓一个
sentinelK
6 小时 25 分钟前
绝大多数的“总结”方案都是直接扒字幕的。

也就是说,如果你要的视频观点、内容主要以语言的形式呈现,那么效果就不错。
如果是以视觉效果呈现,成本就比较高了。

举个例子,比如有的 up 喜欢说“结论如图”/“自己截屏查看”,这种情况市面上的“总结”方案就做不到。
isnullstring
6 小时 7 分钟前
@sentinelK 对的,有些视频没有字幕或者某些敏感内容只有语音没有字幕时候就缺失
isnullstring
5 小时 47 分钟前
找 AI 做一个呗,不过用 whisper 转录最好有显卡,纯 CPU 转不是一般的慢,往往是音频时长的 3 倍
一个使用 yt-dlp 自动下载,一个扫描下载目录按预设参数和提示词生成笔记

https://imgur.com/a/JGdENKm

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1212791

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX