AI 开发了个《武林外传》全台词检索对应截图网站

https://wulinwaizhuan.hugo2233.dpdns.org/ 文本提取：PaddleOCR (PaddlePaddle 引擎) 暴力破解硬字幕。数据归档：构建台词-时间戳-图片路径的索引。抽帧处理：FFmpeg 获取关键帧。图像预处理：OpenCV + NumPy 提高识别率。

难题攻克：针对 TV 录制版没有软字幕的问题，OCR 是唯一解。通过批量推理，将 80 集海量素材转化为可检索的 JSON 文件

一开始 win 直接运行代码好慢 80min 一集现在在 wsl 上运行 5-8min 一集舒服了

参考项目 github 的 Cicada000/VV 感谢指导

cadl

23 小时 56 分钟前

哈哈点子太好玩了，点赞。前几天看到你的帖子，昨天教不会写代码的老婆尝试 claude code ，就是拿这个当例子，搞了个《马大帅》版本的。

https://biaoleme.llpsh.com/

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1191155

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.