基于多权值神经网络的语音情感识别的研究

论文摘要

如何识别说话人情感是目前语音技术领域中一个比较热门的话题。有许多学者对情感语音特征提取和自动情感分类进行了研究，并提出了许多方法，但是目前语音情感识别的效果远低于人们所期望的识别结果。针对这个问题，本文提出了一种新的语音情感识别方法——基于多权值神经网络的语音情感识别。本文首先提出了特征空间样本点的图几何理论以及图几何理论中的有关性质，通过图论的概念，研究了特征空间样本点的性质，在凸胞的基础上提出了有关子图的运算方法，并且利用子图的空间样本点之间距离作为权值提出基于图几何理论的多权值神经元。对情感语音的特性进行了探讨，对特征向量的提取、数据信息的压缩处理等语音的前处理方法进行研究。参考大量的情感语音理论，根据各个情感特征参数对于语音情感识别方面的影响程度，最终确定了最具有影响力的特征参数作为语音情感识别的特征参数，对预处理后的语音信息进行特征提取，并提出了各特征参数的具体算法。然后根据特征参数研究了基于多权值神经元的语音情感识别的训练和识别算法，通过相关的实验论证了该方法的可行性。与SVM方法相比较的实验结果表明，随着样本数量的增多，两种方法的识别率之间的差距也会慢慢减小，当样本数量趋近无穷时，它们的正确识别率都会渐渐逼近一个峰值。但在神经元个数足够的前提下，基于多权值神经网络的情感语音识别方法的正确识别率仍将高于SVM模型方法的识别率，这是因为基于多权值神经网络的方法描述的是情感语音特征样本点在高维空间的形态分布，而SVM模型方法却仅仅是一种在高维空间中非线性划分的方法，尤其在小训练样本的情况下，由于划分所需的支持向量有限，其精确程度自然不如多权值神经网络的方法。

论文目录

摘要

ABSTRACT

第一章绪论

1.1 语音情感识别的研究背景和现状

1.2 语音情感识别的实用意义和存在的问题

1.3 神经网络的发展背景与现状

1.4 仿生模式识别与多权值神经网络介绍

1.5 论文研究内容及结构安排

1.6 本论文的创新点

第二章基于图几何理论的多权值神经网络

2.1 图几何理论的简介

2.2 图论的基本概念以及性质

2.2.1 图与子图

2.2.2 图的运算

2.2.3 通路与回路

2.2.4 E图与H图

2.2.5 树与割集

2.2.6 图的矩阵表示

2.2.7 平面图

2.2.8 网络流

2.2.9 凸胞的概念

2.3 特征空间样本点与子图的运算

2.3.1 特征空间样本点的距离

2.3.2 子图的运算

2.4 基于图几何理论的多权值神经网络的训练与识别

2.4.1 基于图几何的多权值神经元的确定

2.4.2 基于图几何理论的多权值神经网络的训练

2.4.3 基于图几何理论的多权值神经网络的识别

2.5 本章小结

第三章情感语音特征参数提取及算法实现

3.1 语音的特征参数分析

3.1.1 语音的短时特性和窗函数

3.1.2 语音时域特征参数分析

3.1.3 语音频域特征参数分析

3.2 情感语音的特征提取及算法实现

3.2.1 语音发音持续时间比例

3.2.2 基音周期

3.2.3 共振峰

3.3 本章小结

第四章基于多权值神经网络的语音情感识别及其比较

4.1 情感类型的划分

4.2 语音情感特征的选择和提取

4.3 语音情感识别的所用样本库的建立

4.4 多权值神经网络的构建与识别过程

4.4.1 多权值神经网络的构建具体算法描述

4.4.2 多权值神经网络的识别

4.5 实验结果与讨论

4.5.1 本实验的统计结果与讨论

4.5.2 与SVM模型的比较结果

4.6 本章小结

第五章总结和展望

5.1 总结

5.2 进一步的工作

参考文献

附录

致谢

攻读学位期间发表的学术论文目录

基于多权值神经网络的语音情感识别的研究

论文摘要

论文目录

相关论文文献

猜你喜欢