论文摘要
随着应用需求的增加,对声音识别的研究不再只是局限于语音识别,人们开始把目光投向非语音的环境声音识别。环境声音在众多领域有重要应用,如辅助机器人技术,监督安全领域,自动导航仪等。环境信息包含丰富的信息,研究环境声音对了解环境,预测环境的变化及改善环境与人类的关系具有重要意义。然而环境声音背景噪声大,频率范围宽及所需模版信息量大的特点以及现有技术的制约限制了对环境声音的进一步研究。为此,本文从声音去噪,声音数据处理及声音分类识别算法等方面进行研究,以提高环境声音分类识别的准确性。本文的研究包括以下内容:1)环境声音信号去噪:使用改进的小波阈值去噪法对声音进行去噪,以提高声音识别的准确性。该方法使用折衷的阈值函数,克服了软阈值函数固定偏差和硬阈值函数不连续的缺点。使用10种鸟叫声进行实验,用信噪比和均方误差作为评估标准,比较软阈值函数,硬阈值函数和折衷阈值函数的去噪效果。2)特征提取:提出用时间编码信号处理与识别(TESPAR)算法对环境声音进行处理。TESPAR用D/S描述符描述波形,用矢量量化算法构造一个TESPAR字符表,根据字符表提取波形的字符流,最后生成TESPAR矩阵。使用TESPAR算法对二十种环境声音进行分类识别,比较使用不同TESPAR矩阵的识别效果。通过实验选择表征特征能力较好的log(A)矩阵。此外还测试TESPAR在不同信噪比下的识别性能。3)分类识别:TESPAR算法对环境声音进行处理会得到固定的TESPAR矩阵,和人工神经网络使用定长向量训练的要求很匹配。而且人工神经网络是一种客观实用的分类方法。设计构造快速人工神经网络(FANN),基于上述的小波去噪,TESPAR算法实现对环境声音的识别。对使用FANN方法和原型方法的识别效果进行对比。通过以上的研究可以得出,改进的小波阈值去噪法可以对环境声音进行有效去噪,使用TESPAR和人工神经网络结合的模型对环境声音进行分类识别可以取得良好的分类识别效果,具有较好的抗噪性。
论文目录
相关论文文献
标签:环境声音论文; 小波阈值去噪法论文; 时间编码信号处理与识别论文; 人工神经网络论文; 原型方法论文;