A 视频为短视频,B 视频为长视频,A 视频中的所有片段均由 B 视频中剪辑出来(可能经过处理,比如加字幕,加上下边距等)。现在需要检索 A 视频中的所有片段出现在 B 视频中的哪个时间点。
思路:每秒抽取一个关键帧,然后通过图片相似度算法从 B 中找出最匹配的帧,粗略实现了一版,发现效率太低了。假设 A 视频 10 分钟,B 视频 120 分钟,那么平均需要对比 600*12 = 7200 次,图片相似算法使用的 ssim,匹配准确度也不理想。
是否有其他思路,或者开源解决方案,或者付费产品?