MFCC 是 Mel-frequency cepstral coefficients 的缩写,中文常译为梅尔频率倒谱系数。它是一种把音频信号(尤其是语音)的频谱特征压缩成一组数字特征的表示方法,广泛用于语音识别、说话人识别、音频分类等任务。(在不同领域还可能有其他含义,但最常见的是语音信号处理中的这一项。)
/ˌɛm ˌɛf ˌsiː ˌsiː/
We extracted MFCC features from the recording.
我们从这段录音中提取了 MFCC 特征。
Because MFCCs approximate how humans perceive sound frequency, they are often used as input features for speech recognition models.
由于 MFCC 能近似反映人类对频率的感知方式,它们常被用作语音识别模型的输入特征。
MFCC 来自信号处理术语组合:Mel-frequency(梅尔频率,基于人耳感知建立的频率尺度)+ cepstral(倒谱,源自对 spectrum “频谱”一词进行字母调换的幽默式命名,用来表示对数频谱再做变换得到的域)+ coefficients(系数)。整体指“在梅尔尺度下计算得到的倒谱系数”。