有没有可以从两段 音频/视频 中,提取相同部分的项目?

2021-11-01 10:34:30 +08:00
 Garasu

如题, 找了下没找到,有知道的吗

1343 次点击
所在节点    编程
20 条回复
bfdh
2021-11-01 10:58:38 +08:00
先定义“相同”?
ch2
2021-11-01 11:01:40 +08:00
多大程度的相同才算相同
wyttt
2021-11-01 12:22:42 +08:00
类似语音验证码这种嗯的?
Garasu
2021-11-01 12:31:34 +08:00
@ch2
@bfdh

喔。。。 不好意思。

1.相同就是指 人感官上认为的相同

2.多大程度相同这部分 应该是让使用者手动设置的吧?
Garasu
2021-11-01 12:32:47 +08:00
@wyttt 并不是, 是需要从 两段 媒体中 提取 相同 /相似 部分
bfdh
2021-11-01 12:36:37 +08:00
单就视频来说,把每帧图像看作一张图片,这样就变成从两个图片集合中找相似图片了,这是不是就简单了。
Jinyao
2021-11-01 12:43:10 +08:00
视频 dna
Garasu
2021-11-01 12:44:50 +08:00
@bfdh

确实,有这样的项目吗? 我去康康。

只是,这样的运算量是不是会过大? 用图来 确定 这个相同部分的两端处 是不是会比较难? 前后如果在相同的场景下发生,动作变化也不大的话 不太好判定吧。
gcyrn
2021-11-01 12:50:10 +08:00
虽然你发的是编程节点,不过视频后期软件里一般都可以匹配两个片段,根据音频来的,然后你再找到重叠的部分取出来。不过不知道你是什么需求。
Garasu
2021-11-01 12:59:19 +08:00
@gcyrn

需要这样的工具放服务器上 自动处理上传的 音视频。。。
Garasu
2021-11-01 13:01:04 +08:00
@Jinyao

和这个不一样,那是用来检测和自己已经加了指纹的音视频做对比 来判断是否为同一源, 没法检测 两个不同来源音视频 的相同部分吧
pxiphx891
2021-11-01 15:01:06 +08:00
上次我看阿凡达,看完之后发现自己看的是广电删减版,因此又下载了导演剪辑版,但是我又不想重看一遍,我只想看看删减的内容,因此我用 ffmpeg 把两个视频每秒截了一张图,然后用 pHash ,两个 for 循环,把重复的地方都找出来了,但是删的片段非常琐碎,跟我预期不十分一致。
Garasu
2021-11-01 16:15:55 +08:00
@pxiphx891

光靠 pHash 也太粗暴了, 而且速度也比较慢的吧。
pxiphx891
2021-11-01 16:56:46 +08:00
@Garasu 也可以用 dHash ,速度快很多,对我的场景足够用了,不知道你什么场景
Garasu
2021-11-01 18:47:57 +08:00
@pxiphx891

视频取帧 对比 倒是也行,不过我主要是想提取相同部分的声音。
bfdh
2021-11-02 09:35:06 +08:00
@Garasu #8 我理解应该是类似现在各大搜索引擎得相似图片搜索。对于图像 /视频处理我是外行,也不知道有没有类似得项目,感觉上应该有才对。
betteryjs
2021-11-02 16:20:12 +08:00
声音部分可以考虑 数字信号处理 转成频域 比对?
Garasu
2021-11-02 18:58:15 +08:00
@betteryjs

是的,但是个人能力有限,想找类似的项目看一看,没找到。
AJDX3906
2022-05-20 11:18:10 +08:00
@Garasu 请问,找到相关文献或者项目了么
Garasu
2022-05-29 17:02:05 +08:00
@AJDX3906
不好意思,暂时没有,现在这一项目先搁置了。
但是我依然很有兴趣,如果你找到有趣的项目或可行性较高的流程方案的话,能联系下我吗?
uzibird@163.com

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/812049

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX