论文摘要
情感和情绪在人类生活中起着很重要的作用,是自身生活和社会交往不可缺少的重要组成部分,而语音信息则是传递情感信息最直接的方式。随着现代科学的发展,人们对人工智能的要求也越来越高,对情感信息的处理已经成为人工智能发展的一个重要研究方向。在传统的语音信号处理过程中,计算机并没有被赋予理解操作者情绪的能力,只局限于理解语音信号的表层符号信息,更不能实现类似人类之间交流的情感互动,而语音情感信息处理这个研究方向的最终目的就是要赋予人工智能类似人一样的观察、理解语音信号中的情感信息,以及表达各种情感的能力,它是综合听觉生理学、心理学、认知科学以及与信息处理等多学科的研究课题。论文首先概述了课题的研究背景以及语音情感处理的发展历史,并简单回顾了情感空间的界定方法和人机通信中情感语音处理技术的研究发展现状。通过对语音信号处理的深入研究,选取了适用于本实验的语音情感参数。论文中采用基频构造参数、能量构造参数、时间构造参数和共振峰构造参数作为分析用的基本韵律特征参数,对德语情感语音样本库和普通话情感库进行参数提取,分析。在模式识别方面,对比使用了三种方法:经典的主元分析法(PCA),基于模糊隶属函数的模糊模式识别法和高斯混合模型法(GMM)。并对模糊模式识别方法做出了改进,将PCA的最大可分性原理运用到参数有效性分析上,获得了不错的效果,平均识别率达到80%以上。
论文目录
摘要ABSTRACT第一章 绪论1.1 情感计算1.2 语音情感识别1.2.1 语音情感的分类1.2.2 语音与情感模式的对应关系1.2.3 语音情感识别的关键技术问题1.2.4 国内外相关研究1.2.4.1 国外相关研究1.2.4.2 国内相关研究1.3 本文研究内容、结果及创新点第二章 情感语音数据库2.1 情感数据库建立的原则2.2 情感语音数据的分类2.2.1 自然型情感语音2.2.2 表演型情感语音2.2.3 引导型情感语音2.3 国内外具有代表性的情感语音数据库2.4 实验选用的数据库2.5 小结第三章 语音信号分析3.1 语音信号的数字化和预处理3.1.1 采样和量化3.1.2 预处理3.2 语音信号的时域分析3.2.1 短时能量及短时平均幅度分析3.2.2 短时过零率分析3.2.3 短时相关分析3.2.4 短时平均幅度差函数3.3 语音信号的倒谱分析3.3.1 同态信号处理的原理3.3.2 倒谱分析3.4 语音信号的线性预测分析3.4.1 线性预测分析的原理3.4.2 预测系数求解3.5 小结第四章 语音情感特征参数的选择和提取4.1 语音情感特征参数的选择4.2 各情感特征参数的提取4.2.1 振幅相关参数4.2.2 时间相关参数4.2.2.1 发音持续时间4.2.2.2 语速4.2.3 基音相关参数4.2.3.1 基音检测4.2.3.2 基音检测的后处理4.2.4 共振峰参数4.3 小结第五章 语音情感的分类识别5.1 主分量分析法5.1.1 PCA 方法的数学模型5.1.2 PCA 方法在语音情感识别中的应用5.1.3 实验结果及分析5.2 基于模糊集隶属函数的语音情感识别5.2.1 模糊模式识别概念5.2.2 模糊模式识别在情感语音中的应用5.2.2.1 利用模糊熵进行有效性分析5.2.2.2 将PCA 方法用于参数有效性的度量5.2.3 实验结果及分析5.3 高斯混合模型5.3.1 单一高斯机率密度函数的参数估测法5.3.2 高斯混合密度函数的参数估测法5.3.3 高斯混合模型在语音情感识别中的应用5.3.4 实验结果与分析5.4 语音情感识别原型系统5.5 小结第六章 总结与展望6.1 总结6.2 进一步的工作6.3 语音情感的应用前景致谢参考文献
相关论文文献
标签:情感计算论文; 语音情感识别论文; 主元分析法论文; 模糊模式识别论文; 高斯混合模型论文;