有什么办法可以批量根据 mp3 内容快速分类的

This topic created in 1488 days ago, the information mentioned may be changed or developed.

每个 mp3 音频大概 10 秒左右，需要人听才能分类到 1,2,3
人工操作就是把所有 mp3 拖到播放器然后播一个，再去文件管理器复制粘贴，得弄死

目前想到一个思路自己写脚本命令行逐个播放（ ffmpeg?），然后根据听到的内容（不用听完，可能 3 秒或 5 秒就能分辨）按键盘 1,2,3 直接打断播放（监听键盘事件然后打断当前播放并播放下一个）然后复制到对应分类文件夹

这个思路行得通吗，大家还有更好的工具或者思路吗

Supplement 1 · Jun 23, 2022

感谢兄弟们的建议，不过分词语言处理 AI 相关的是行不通的（需要联系上下文，且含有外语），退一万步就算行得通，怎么调教，怎么分类写这个规则就很耗时而且不一定完美，我还是得全部听一遍复验（几千个文件），结果还是没效率的

mp3

播放

分类

打断

22 replies • 2022-06-25 09:59:54 +08:00

Soar360

Jun 23, 2022

语言转文字，分词，然后自动归类？

0x2CA

Jun 23, 2022

行的通，但是你开发一个花费时间找就分好了，除非你量大，而且后面经常用

shilianmlxg

Jun 23, 2022

不如用 sony 的 mediago 。记得它的分类是自带。只是解析很慢

jhjguxin

Jun 23, 2022

写个程序主要做下面几件事情
第一步遍历需要处理的文件列表
第二步截取每个文件的前 10 秒（如果文件数量并不大，长度也小可以忽略此步骤）
第三步调用类似科大讯飞语音转写 API 接口（ https://www.xfyun.cn/doc/asr/lfasr/API.html ）
第四步在提取出的文字中匹配你所需的分类关键字，如果成功进行第五步
第五部根据匹配到的关键字将对应文件进行分类处理
第六步将前面第 2-5 步操作失败的文件单独标记进行人工处理即可

snoopyhai

Jun 23, 2022

网上有语音质检的能力. 找找看. 能不能基于质检去做一些特别设定.

hikarugo

Jun 23, 2022

@0x2CA 量大，几千个

darkengine

Jun 23, 2022

speech to text ，再接个自然语言处理，然后分类

hikarugo

Jun 23, 2022

@Soar360
@shilianmlxg
@snoopyhai
@jhjguxin

感谢提供建议，不过分词是铁定不行的，有时候还需要联系上下句语义才能处理，而且有的还包含外语，所以只能人工听才能分。

Buges

Jun 23, 2022 via Android

如果隐私能接受，直接买讯飞的转文字（中文）

tfdetang

Jun 23, 2022

突然让我想到前段时接很火的那个电视剧 <人生切割术>

其实我很好奇，人是怎么分类的？标准是什么？因为只要听 10 秒感觉应该也不是特别复杂的上下文理解

其实用 AI 分类不一定非要转文字啥的，也可以直接拿着音频数据作为一个序列信息来进行分类啊。也不需要写任何规则只需要先人工分一部分数据就行了。

只是一共就几千条数据上 AI 显然是不太划算的，得是一个持续性的长期工作才有价值

Juszoe

Jun 23, 2022

几千个还是人工处理吧，但 OP 有些小看 AI 了，这种分类是标准的 AI 适用场景，不需要写规则，打上类别标签就好了，难点就在于数据集要自己收集。
如果要求 100%准确率，可能 AI 确实不合适

wudicgi

Jun 23, 2022

如果机器识别不可行的话, 楼主需要的是一个可以在界面上当场进行文件重命名操作的音频播放器？

yufeng0681

Jun 23, 2022

原始诉求还得往前回溯。目前看是你想要的一个解决方案。
1 、如果是长期工作，能不能让负责提供素材的人，就按照要求格式提供素材；
2 、如果是自己采集的素材，也是临时工作，那就看看有没有其他规律可以寻觅，不行的话就只能人工分拣。
3 、人工分拣，建议用阿里云盘。它能在线播放音频。
3.1 你听到 1 类的，你就收藏，进入收藏库
3.2 你听到 2 类的，你就下载，再次下载到本地目录 2
3.3 如果是 3 累的，你不用处理，等全部处理完毕，把收藏 1 类的下载到本地第二个目录 1
3.4 你把本地音频和下载的 1 2 类音频放一起，全部排序，按同名排序，把孤单的 3 类文件，ctrl 选中，然后复制一份到新的目录 3 里，就成了。

yufeng0681

Jun 23, 2022

注：阿里云盘的音乐播放界面，有上一项，下一项，收藏，下载，分享，按钮。

重命名和移动按钮在 more 里面，要多点击一下，麻烦。。

hikarugo

Jun 23, 2022

@yufeng0681 谢谢，很有收获。我试了一下云盘下一项的时候并不会自动播放而是顺序播完才播的下一项，而且按空格也不会触发播放，这一点挺难受的，不知可有解决方案。

libook

Jun 23, 2022

加个撤销机制以防按错，然后我觉得就可以做个 MVP 方案让负责分类的人员试用一下了，看是否提升了效率，然后根据反馈再优化。

dddd1919

Jun 23, 2022

100 块钱，雇个人

yufeng0681

Jun 23, 2022

@fyxtc 感觉是阿里云盘的一个 bug ，或者说体验不合理的地方，要不给阿里云盘提个问题单，让他修复一下？

下一项，如果不想动。那就在播放器那边增加上一曲，下一曲的功能，切换快捷键是播放器的必须项目。

XimuTao

Jun 24, 2022

根据按键分类这个思路, 我写过一个用来分类图片的[photo-classification]( https://github.com/ximu-tao/photo-classification), 需要的话我可以帮你改一个音频版本的

hikarugo

Jun 24, 2022

@XimuTao 看了下，很适合我的需求，我如果你有时间弄的话，那就太感谢了

XimuTao

Jun 24, 2022

@fyxtc https://github.com/ximu-tao/photo-classification/releases ，下载 audio-classification ，因为一直只有自己在用，所以有些小问题一直没修复，使用的时候注意一下

hikarugo

Jun 25, 2022

@XimuTao 用上了，完美解决，已 star ，感谢