我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 语音处理 >

语音信号预处理

归档日期:07-14       文本归类:语音处理      文章编辑:爱尚语录

  我只知道预处理有采样量化、A/D转换、滤波、预加重、端点检测,不清楚MFCC,但我看MFCC里面有,所以我不懂还做不做。

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  展开全部MFCC是计算语音信号的Mel频率倒谱系数,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。

   预滤波(低通):前端带宽为300-3400Hz的抗混叠滤波器。

   A/D变换:采样频率,线; 预加重:通过一个一阶有限激励响应高通滤波器,使信号的频谱变得平坦,不易受到有限字长效应的影响。

   分帧:根据语音的短时平稳特性,语音可以以帧为单位进行处理,实验中选取的语音帧长为32ms,帧叠为16ms。

   加窗:采用哈明窗对一帧语音加窗,以减小吉布斯效应的影响。

   三角窗滤波:用一组Mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应。

   求对数:三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。

   谱加权:由于倒谱的低阶参数易受说话人特性、信道特性等的影响,而高阶参数的分辨能力比较低,所以需要进行谱加权,抑制其低阶和高阶参数。

   差分参数:大量实验表明,在语音特征中加入表征语音动态特性的差分参数,能够提高系统的识别性能。可用到了MFCC参数的一阶差分参数和二阶差分参数。

  计算mfcc时的滤波,看起的作用是什么?如果是进一步消除噪音,那就必须做。

  MFCC是计算语音信号的Mel频率倒谱系数,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。

  2、A/D转换就是《数字信号处理》中量化,会带来量化误差;(简单的部分掠过)

  5、分帧加窗也容易:matlab一句话的事,viocebox里的enframe函数。(如果你

  6、mfcc:变换到mel频度来模拟人耳听觉特性。套话就不说了,你也知道目前用

  在语音处理最合适。程序网上也有很多,我想说的是现在有很多改进的mfcc,你

本文链接:http://thegoodfrog.com/yuyinchuli/276.html