论文摘要
情绪与情感极大地影响着我们的日常生活,在人工智能迅猛发展的今天,如何让计算机处理情感信息,创造更为和谐的人机对话环境,成为了一个新的研究热点。语音是人与人之间交流信息与情感的重要手段,让计算机读懂语音中的情感信息,可以使人机之间的情感交流更为方便,更为自然。本文在之前研究者们的基础上,对语音中情感信息的识别展开了研究,研究的主要内容包括:一、语音信号的预处理。对于情感语音库中的语句进行了预加重、加窗分帧与端点检测处理。二、语音情感特征的分析与提取。总结之前研究者们所常用的用于语音情感分析特征,从中选择了部分统计特征组成特征向量,这些特征包括短时能量的最大值、最小值和均值;短时过零率的最大值、最小值和均值;语音持续时间;基音的最大值、最小值和均值以及前三个共振峰的最大值、最小值和均值。三、对特征空间做了简要的分析,并对用于实验的特征和样本做了特征降维与去野点操作。四、受到一些生物现象的启示,引入遗传算法与“新回路”机制,对BP网络进行了改进,并将改进后的网络的性能与其他改进算法进行了类比与比较。最后,进行两种算法的结合,得到一种新的IN-GABP神经网络,并分情况对这个新的网络进行了性能的比对与分析。