V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
pangpang
V2EX  ›  Python

关于 python 对语音处理的问题

  •  
  •   pangpang · 2016-07-10 14:27:43 +08:00 · 4345 次点击
    这是一个创建于 2848 天前的主题,其中的信息可能已经有所发展或是发生改变。

    近期想用 python 对语音处理,去除里面的人声,然后对背景声音进行分析,来初略判断所处环境。(别问为什么,都是有苦衷的) 但是本人对语音处理不是很熟悉不知道有什么好的开源项目学习一下或者现成的库

    22 条回复    2016-07-11 22:46:08 +08:00
    SeanChense
        1
    SeanChense  
       2016-07-10 15:44:49 +08:00 via iPhone
    这怕是不是简单一两个库就能解决的,而且有没有这种库都还是问题。

    你自己要做的就是把信号源中把人的声音剥离出来,那么就要定义什么是人的声音。在时域是什么样的,在频域是什么样的,各自特征值是什么。然后设计一个滤波器,把不要的噪声剔除。
    完成了以上工作,我猜发个 SCI 可能问题不大。
    SeanChense
        2
    SeanChense  
       2016-07-10 15:46:40 +08:00 via iPhone
    或许已经有类似的研究了,楼主需要了解的是数字信号处理。查查看一些期刊论文。
    kamikat
        3
    kamikat  
       2016-07-10 16:12:23 +08:00
    pangpang
        4
    pangpang  
    OP
       2016-07-10 16:37:21 +08:00
    @SeanChense 谢谢,我近期学习一下,本行是无线网络方向的,对数字信号确实不了解
    pangpang
        5
    pangpang  
    OP
       2016-07-10 16:38:36 +08:00
    @kamikat 谢谢啦
    TaMud
        6
    TaMud  
       2016-07-10 17:19:50 +08:00
    TaMud
        7
    TaMud  
       2016-07-10 17:20:14 +08:00
    如果你能搞出来,直接投简历 google,ms 都可以
    264768502
        8
    264768502  
       2016-07-10 18:16:49 +08:00 via iPad
    pangpang
        9
    pangpang  
    OP
       2016-07-10 19:48:14 +08:00
    @TaMud 看来要达成这个目标需要付出挺多精力了
    pangpang
        10
    pangpang  
    OP
       2016-07-10 19:48:33 +08:00
    @264768502 谢谢
    pangpang
        11
    pangpang  
    OP
       2016-07-10 19:50:02 +08:00
    @SeanChense 其实我的目的只是某个人的声音特征就够了,别人的我也不关心。这样想的话好像还能变简单一点了
    shakespaces
        12
    shakespaces  
       2016-07-10 20:07:22 +08:00 via Android
    这的确是个大项目,应该是单独拿出来都能立项的
    jason0916
        13
    jason0916  
       2016-07-10 20:59:13 +08:00
    结合楼主的描述和回复,我已经脑补了各种剧情 = =
    TaMud
        14
    TaMud  
       2016-07-10 21:09:08 +08:00
    中科讯飞,百度,微软, google ,都想解决这个问题
    pangpang
        15
    pangpang  
    OP
       2016-07-10 21:37:55 +08:00
    @jason0916 别这样,我已经够可怜了
    gulu
        16
    gulu  
       2016-07-11 06:37:37 +08:00 via Android
    去人声的没有,去噪声可以用 Adobe Audition 。 或者可以反着来去噪了再和原声对比求差?
    qcts33
        17
    qcts33  
       2016-07-11 10:34:48 +08:00
    本行无线网络,没学过数字信号处理?我读书少,你不要骗我……
    本来想说 python 不适合这种信号处理任务,但发现 scipy 里面基本的滤波器设计都有
    不过这种任务确实体现不出 python 的优势,我觉得还是 MATLAB 实在,至少设计滤波器这种事情就没有必要反复敲代码了
    puyaraimondii
        18
    puyaraimondii  
       2016-07-11 11:47:43 +08:00
    前期去噪,预处理方法可以,根据你的数据选择合适的方案
    去除人声可以根据声音频率特征,找一个或几个合适的 window function 就行
    背景声音分析我只知道你在有了足够的背景声音库的基础上采用的方法,例如 DTW,HMM,ANN 等等,或者 Machine Learning 也有一堆,其他的方案不了解
    万方,知网那一堆数据库搜搜的话其实挺多可以参考的
    暂时只想到这些,同在学习
    pangpang
        19
    pangpang  
    OP
       2016-07-11 15:03:49 +08:00
    @qcts33 ^_^不能说没学过,只是不是强项。遇到数字信号方面,请教都是实验室的其他人
    pangpang
        20
    pangpang  
    OP
       2016-07-11 15:04:04 +08:00
    @puyaraimondii 谢谢啦
    pangpang
        21
    pangpang  
    OP
       2016-07-11 15:04:13 +08:00
    @puyaraimondii 谢谢指教
    jason0916
        22
    jason0916  
       2016-07-11 22:46:08 +08:00
    @pangpang 别太难过了,祝你好运少年
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   899 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 22:13 · PVG 06:13 · LAX 15:13 · JFK 18:13
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.