论文摘要
鸟类是人类的好朋友,也是生态环境的重要成员,保护鸟类对于维护生态环境的平衡具有重要的作用。而相比形态特征,鸟声不仅容易采集而且更具物种特异性,因此,通过鸟声识别来进行鸟类物种保护具有重要的现实意义。然而,在实际的鸟声识别中,现场采集到的信号中往往夹杂着各种不可避免的环境噪声,因此,研究噪声情境下的鸟声识别技术更具有实际的应用价值。鉴于此,本文研究了一个基于时频图纹理特征和随机森林分类器的抗噪鸟声识别方法。本文的研究工作主要包括以下几个方面:1)前端处理。针对传统的噪声估计往往需要事先假设背景噪声是平稳的,因而不能较好地处理实际的非平稳环境噪声的问题,本文通过将一种基于双向路径搜索的动态噪声功率谱估计算法与经典的短时谱声音增强技术相结合,提出了一种适用于高度非平稳环境噪声的声音增强算法,并以此实现对带噪鸟声信号的前端去噪处理。2)对鸟声信号进行音节分割。本文通过对鸟声信号的多样性、多变性以及语法结构等特点进行分析,提出了一种基于二维时频矩阵的音节分割算法,该算法通过比较每个时频点的幅度谱来定位每个音节在整个时频图中的起始位置,从而实现连续鸟声信号的音节分割。3)纹理特征提取。本文通过观察不同鸟声信号的时频图,发现它们包含着许多截然不同的纹理图案,相互之间很易区分,于是将时频图纹理信息引入到鸟声信号的特征提取中,并考虑将每个音节作为基本的纹理分析单元,使用图像处理中的灰度共生矩阵纹理分析法,提取四个方向上的五种纹理特征。在计算纹理特征时,针对传统灰度共生矩阵法存在的运算开销大、存储空间浪费严重等问题,本文考虑使用一维向量来存储每个共生灰度对的和与差,并使用得到的和向量与差向量计算相应的纹理特征值。4)分类器识别。针对分类器集成技术可以有效提高识别精度和避免数据过拟合的特点,本文使用一种基于决策树的集成分类器模型—随机森林来对每个音节的纹理特征向量进行模型训练和分类识别,而每个待测鸟声信号的最终识别结果则由它包含的所有音节类别的多数投票结果而定。实验结果表明,本文的方法不仅能够准确快速地识别鸟声而且还能适应不同类型的环境噪声,可以为进一步研究其他类型的生态环境声音提供一定的参考。