ffmpeg 提取音频中有声部分并单独生成文件

2022-11-02 10:10:27 +08:00
 PuppetFrost
最近在利用 ffmpeg 处理一些客服工单的 wav 音频文件,已经分别将客服人员和客户的音频分开了。
目前的音频波形是这样: https://imgur.com/a/L86Y5aX
红框内为静音部分。
现在想要将其中每个有声音的部分,都单独提取出来生成文件。也就是说,客服人员(客户)说的每句话都单独生成一个独立的 wav 文件,自己尝试了下 silencedetect 无果,请问各位大佬 ffmpeg 可以做到这一点么?
1166 次点击
所在节点    FFmpeg
2 条回复
VitoD
2022-11-02 10:28:13 +08:00
或许你可以考虑 avd ,webrtc-vad
wangritian
2022-11-02 10:32:23 +08:00
https://github.com/cpuimage/WebRTC_VAD
这个是大佬从 webrtc 大项目剥离的 vad ,自己写代码做切分吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/891984

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX