我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 语音处理 >

语音信号处理

归档日期:06-28       文本归类:语音处理      文章编辑:爱尚语录

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  在新的语音产生模型指导下,以现有语音特征提取方法为基础,研究一套新的语音特征表示和提取方法,使语音特征的提取结果更精确,把完整的语音信息提交给语音识别的高层次处理模块,为实现理想的语音识别系统打下关键基础是本项目的研究内容和目的。

  语音特征参数提取(Speech Feature Extraction,简记为SFE)是语音识别(包括话者识别、语种识别等)的前端处理功能。没有好的SFE功能模块,整个语音识别系统的性能不可能很好。所以SFE一直是语音处理领域研究的重点之一。

  SFE研究从1900年即开始,经历了硬件滤波器、FFT、LPC、基音提取、倒谱等参数提取方法。当前的SFE方法是多种方法的集成结果,比如MFCC是带通滤波和倒谱的组合。在几种常用方法中,MFCC较为突出,应用最为广泛。

  MFCC是Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient)的简称。其是将信号的频谱,首先在频域将频率轴变换为Mel频率刻度,再变换到倒谱域得到的倒谱系数。在实际应用中,MFCC的计算过程是这样的:

  求它的频谱幅度的平方,即能量谱,并用一组三角形滤波器在频域对能量谱进行带通滤波。这组带通滤波器的中心频率是按Mel频率刻度均匀排列的,每个滤波器的三角形的两个底点的频率分别等于相邻的两个滤波器的中心频率,即每两个相邻的滤波器的过渡带相互搭接,且频率相应之和为1;滤波器的个数通常与临界带数相近(略小),设滤波器数为M,滤波后得到的输出是:

  将滤波器组的输出取对数,然后对它做2M点逆离散傅立叶变换即得到MFCC。

  以MFCC为代表的常用特征提取方法是否完全满足语音识别的要求?有没有必要进一步改进的必要?

  语音识别技术分特征提取、声学语音学和语言学三大模块。目前,从整体上讲,语音识别效果还远远不能令人满意,其原因除了声学语音学和语言学高层次处理模块有待改进之外,特征提取也是影响识别效果不佳主要因素之一。理由如下:

  1) 人耳的最高时间分辨率达到2ms,而目前SFE方法的分析帧长为20-30ms,对于爆破音,塞擦音等辅音,信息丢失严重。

  2) 人耳的最高频率分辨率达到1.8Hz, 而目前SFE方法的频率数量级是50Hz ,f=1/T=1/0.020=50Hz。低的频率分辨率不能精确提取基音和共振峰等浊音特征。

  1) 为了兼顾辅音时间分辨率的要求,对于元音段,目前SFE方法的分析帧长和窗的移动步长偏短,完全可以加大。加大后,不仅可以减少特征的数据量,从而减少计算量,而且可以提高频率分辨率。

  2) 考虑的兼顾元音的频率分辨率的要求和计算量问题,对于多数辅音段,目前SFE方法的分析帧长和窗的移动步长偏长,应该更短。缩短后,才可以分析辅音的细节特征,获取语音中极其重要的辅音信息。

  综述以上讨论,结论是应该有两种时频分辨率不同的并行的语音特征提取过程。这样做,特征提取过程变得复杂,但现在计算机技术可以应付。

  MFCC是建立在图1所示的语音产生模型之上。假设在声道的同一空间点激励而产生清音和浊音。本项目提出图2所示语音产生模型,并在该模型指导下研究新的语音特征提取方法。图1 和 图2 模型的差异是后者以为噪声激励信号和基音激励信号在声道的不同空间位置产生,更符合语音产生的实际过程。比如发元音的激励点在声门,而发清音时的激励点决不在声门,如 /s/ 在齿位。

  (4) 提取得到的语音特征表示形式便于应用现有的高层次语音识别方法完成语音识别任务。

  4) 提出清音特征浊音特征浊音特征同步和融合的概念,并给出相应方法,即时间同步独立匹配法。

  本项目提出一种新的语音产生模型,并结合已有的特征参数提取等方法,研究一种新的语音特征表示方法。

  语音特征表示是语音的各种特征参数(比如基音和声道参数)共同按照某种结合关系建立起来的对语音单位的一种合理表示。

  二、 报告正文:参照以下提纲撰写,要求内容翔实、清晰,层次分明,标题突出。

  1. 项目的立项依据(研究意义、国内外研究现状及分析,附主要参考文献目录。)(基础研究需结合科学研究发展趋势来论述科学意义;应用研究需结合国民经济和社会发展中迫切需要解决的关键科技问题来论述其应用前景。)

  2、项目的研究内容、研究目标,以及拟解决的关键问题。(此部分为重点阐述内容)

  3、拟采取的研究方案及可行性分析。(包括有关方法、技术路线、实验手段、关键技术等说明)

  5、年度研究计划及预期研究结果。(包括拟组织的重要学术交流活动、国际合作与交流计划等)

本文链接:http://thegoodfrog.com/yuyinchuli/170.html