ffmpeg 提取音频中有声部分并单独生成文件

2022 年 11 月 2 日

PuppetFrost

最近在利用 ffmpeg 处理一些客服工单的 wav 音频文件，已经分别将客服人员和客户的音频分开了。
目前的音频波形是这样： https://imgur.com/a/L86Y5aX
红框内为静音部分。
现在想要将其中每个有声音的部分，都单独提取出来生成文件。也就是说，客服人员（客户）说的每句话都单独生成一个独立的 wav 文件，自己尝试了下 silencedetect 无果，请问各位大佬 ffmpeg 可以做到这一点么？

1952 次点击

所在节点

FFmpeg

2 条回复

VitoD

2022 年 11 月 2 日

或许你可以考虑 avd ，webrtc-vad

wangritian

2022 年 11 月 2 日

https://github.com/cpuimage/WebRTC_VAD
这个是大佬从 webrtc 大项目剥离的 vad ，自己写代码做切分吧

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/891984

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.