基于HHT的语音情感识别研究

基于HHT的语音情感识别研究

论文摘要

语音情感识别要求从语音样本中提取情感特征参数,并采用一定的模式识别方法,识别语音中包含的情感类型。这是语音信号处理一个新兴的研究方向,具有广阔的应用前景。语音情感识别中,如何提取能有效反映情感信息的特征是最关键的问题,它直接决定识别的结果。本文用希尔伯特-黄变换(HHT)对情感语音进行处理,从整体上分析其特征,并在此基础上提取特征参数,进行文本无关和说话人无关的语音情感识别,取得满意的效果。具体内容如下:详细论述HHT的原理,揭示其本质特征和用于信号处理的优点。在此基础上提出边际能量的概念,并将其与边际谱一起用于分析情感语音。对高兴、生气、厌烦和平静四种情感语音进行统计分析,发现边际能量和边际谱分别反映情感语音在时域和频域的能量分布特征,能体现不同情感的内在规律。因此,将其作为情感识别的依据,在边际能量的基础上提取时域特征希尔伯特能量统计值(EHHT),在边际谱的基础上提取频域特征:子带能量(SE)、子带能量一阶差分(DSE)、子带能量倒谱系数(SECC)和子带能量倒谱系数的一阶差分(DSECC)。最后采用矢量量化(VQ)的方法,分别用上述特征做说话人无关、文本无关的语音情感识别。结果表明,单独使用时域特征或频域特征不能有效识别语音情感,而将此两种特征结合用于识别,能使识别率最高达到98.53%,且随码本尺寸的变化波动很小,效果相对稳定。本文将HHT用于情感语音处理,将时频特征结合用于语音情感识别,不仅提高了识别率,而且大大缩小了码本尺寸,具有一定的实际意义。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 语音情感识别的几个关键问题
  • 1.2.1 情感的定义和分类
  • 1.2.2 情感语音数据
  • 1.2.3 情感识别特征
  • 1.2.4 识别方法
  • 1.3 研究现状
  • 1.4 语音情感识别的应用
  • 1.5 本论文主要的研究内容
  • 第2章 HHT 原理介绍
  • 2.1 Hilbert 变换
  • 2.2 瞬时频率
  • 2.3 经验模式分解
  • 2.4 希尔伯特谱
  • 2.5 边际能量和边际谱
  • 2.6 Hilbert-Huang 变换实例分析
  • 2.6.1 谐波信号分析
  • 2.6.2 语音信号分析
  • 2.7 本章小结
  • 第3章 情感语音的边际谱和边际能量分析
  • 3.1 边际谱分析
  • 3.1.1 IMF 边际谱比较
  • 3.1.2 总边际谱比较
  • 3.2 边际能量分析
  • 3.2.1 IMF 边际能量比较
  • 3.2.2 总边际能量比较
  • 3.3 本章小结
  • 第4章 基于边际谱和边际能量的情感特征提取
  • 4.1 基于边际谱的特征
  • 4.1.1 基于信号总边际谱的特征
  • 4.1.2 基于信号IMF 边际谱的特征
  • 4.2 基于边际能量的特征
  • 4.2.1 基于信号总边际能量的特征
  • 4.2.2 基于信号IMF 边际能量的特征
  • 4.3 本章小结
  • 第5章 语音情感识别实验
  • 5.1 文本无关和说话人无关
  • 5.2 实验环境介绍
  • 5.3 矢量量化
  • 5.4 语音情感识别实验
  • 5.4.1 基于第一类特征的识别
  • 5.4.2 基于第二类特征的识别
  • 5.4.3 基于传统特征的识别
  • 5.5 本章小结
  • 第6章 总结和展望
  • 参考文献
  • 致谢
  • 附录A 个人简历
  • 附录B 攻读硕士学位期间撰写的论文
  • 相关论文文献

    标签:;  ;  ;  

    基于HHT的语音情感识别研究
    下载Doc文档

    猜你喜欢