论文摘要
如何识别说话人情感是目前语音技术领域中一个比较热门的话题。有许多学者对情感语音特征提取和自动情感分类进行了研究,并提出了许多方法,但是目前语音情感识别的效果远低于人们所期望的识别结果。针对这个问题,本文提出了一种新的语音情感识别方法——基于多权值神经网络的语音情感识别。本文首先提出了特征空间样本点的图几何理论以及图几何理论中的有关性质,通过图论的概念,研究了特征空间样本点的性质,在凸胞的基础上提出了有关子图的运算方法,并且利用子图的空间样本点之间距离作为权值提出基于图几何理论的多权值神经元。对情感语音的特性进行了探讨,对特征向量的提取、数据信息的压缩处理等语音的前处理方法进行研究。参考大量的情感语音理论,根据各个情感特征参数对于语音情感识别方面的影响程度,最终确定了最具有影响力的特征参数作为语音情感识别的特征参数,对预处理后的语音信息进行特征提取,并提出了各特征参数的具体算法。然后根据特征参数研究了基于多权值神经元的语音情感识别的训练和识别算法,通过相关的实验论证了该方法的可行性。与SVM方法相比较的实验结果表明,随着样本数量的增多,两种方法的识别率之间的差距也会慢慢减小,当样本数量趋近无穷时,它们的正确识别率都会渐渐逼近一个峰值。但在神经元个数足够的前提下,基于多权值神经网络的情感语音识别方法的正确识别率仍将高于SVM模型方法的识别率,这是因为基于多权值神经网络的方法描述的是情感语音特征样本点在高维空间的形态分布,而SVM模型方法却仅仅是一种在高维空间中非线性划分的方法,尤其在小训练样本的情况下,由于划分所需的支持向量有限,其精确程度自然不如多权值神经网络的方法。
论文目录
摘要ABSTRACT第一章 绪论1.1 语音情感识别的研究背景和现状1.2 语音情感识别的实用意义和存在的问题1.3 神经网络的发展背景与现状1.4 仿生模式识别与多权值神经网络介绍1.5 论文研究内容及结构安排1.6 本论文的创新点第二章 基于图几何理论的多权值神经网络2.1 图几何理论的简介2.2 图论的基本概念以及性质2.2.1 图与子图2.2.2 图的运算2.2.3 通路与回路2.2.4 E图与H图2.2.5 树与割集2.2.6 图的矩阵表示2.2.7 平面图2.2.8 网络流2.2.9 凸胞的概念2.3 特征空间样本点与子图的运算2.3.1 特征空间样本点的距离2.3.2 子图的运算2.4 基于图几何理论的多权值神经网络的训练与识别2.4.1 基于图几何的多权值神经元的确定2.4.2 基于图几何理论的多权值神经网络的训练2.4.3 基于图几何理论的多权值神经网络的识别2.5 本章小结第三章 情感语音特征参数提取及算法实现3.1 语音的特征参数分析3.1.1 语音的短时特性和窗函数3.1.2 语音时域特征参数分析3.1.3 语音频域特征参数分析3.2 情感语音的特征提取及算法实现3.2.1 语音发音持续时间比例3.2.2 基音周期3.2.3 共振峰3.3 本章小结第四章 基于多权值神经网络的语音情感识别及其比较4.1 情感类型的划分4.2 语音情感特征的选择和提取4.3 语音情感识别的所用样本库的建立4.4 多权值神经网络的构建与识别过程4.4.1 多权值神经网络的构建具体算法描述4.4.2 多权值神经网络的识别4.5 实验结果与讨论4.5.1 本实验的统计结果与讨论4.5.2 与SVM模型的比较结果4.6 本章小结第五章 总结和展望5.1 总结5.2 进一步的工作参考文献附录致谢攻读学位期间发表的学术论文目录
相关论文文献
标签:多权值神经网络论文; 模型论文; 特征参数论文; 语音情感识别论文; 图几何理论论文;