基于多层能量检测的动物声音检测与识别

论文摘要

随着经济的发展,野生动物的栖息环境和种群结构遭到破坏,越来越多的野生物种濒临灭绝,使野生动物的保护问题和工作变得十分紧迫。然而,现实中的野生动物一般生存在人迹罕见的深林或原野中,人们通常是只闻其声而不见其形,这为研究和保护它们带来了困难。因此,对动物声音进行深入的研究有助于我们更好地分析和认识它们的生存状态,同时对了解某一特定区域的生态环境和预测生态环境的变化等都具有很重要的意义。不过在现实的野外环境中录制的野生动物声音,背景噪声的存在与干扰是无法避免的,所以研究噪声环境中的野生动物声音识别技术则拥有更切合实际的意义。因此本文研究了不同信噪比下野生动物的声音识别方法。本文的相关研究工作主要包含如下：1)信号检测：针对信号检测方法中传统的能量检测(ED)方法不能克服由信号持续长度的不确定性而引入的检测问题,本文采用对原始观测矢量进行连续分割的特定方法来构造多层能量检测结构(MED)以选择最适合的检测器窗口长度,让该窗口长度与未知声音信号的持续时间长度相匹配。同时,我们只对MED中检测概率最高的那一层能量检测器有检测到信号存在的分段进行分帧并提取相应的声音特征,这样可以选取声音信号较强的分段用于训练与测试。2)特征提取与特征选择：针对传统的Mel频率倒谱系数(MFCC)对噪声的易敏感性,以及Mel滤波器会使相邻频带间的频谱能量相互泄露较大,本文提取了更符合人耳听觉特性的Gammatone滤波器倒谱系数(GFCC)以及基于Mel频率尺度分布的小波子带能量系数(WSEC),并对它们进行改进后用于野生动物声音识别。其次,为了利用改进后的WSEC特征和GFCC特征各自的优势之处,本文将这两种特征进行组合后作为系统最终的特征矢量。3)分类算法：对于野生动物声音的识别,选择合适有效的分类器关系着系统的整体性能。本文利用支持向量机(SVM)在噪声情境下的良好稳定性,分别对上述中所提取出来的有效特征及其组合建立相应的SVM分类模型,并通过实验对比不同信噪比下的识别效果。本文以鸟类为研究对象,通过研究不同种类鸟叫声的特征来达到识别不同物种的目的,实验结果表明,该声音识别系统具有较好的噪声鲁棒性,并且为进一步分析不同野生动物物种的声音识别提供了理论和方法基础。

论文目录

摘要

Abstract

第一章引言

1.1 课题研究背景

1.2 课题研究意义

1.3 动物声音识别技术

1.3.1 动物声音识别系统组成

1.3.2 国内外研究现状

1.4 本文主要工作

1.4.1 研究内容和难点

1.4.2 论文结构

第二章多层能量检测结构

2.1 信号检测原理

2.2 能量检测原理

2.3 多层能量检测结构

2.3.1 未知信号持续长度的信号检测

2.3.2 多层能量检测结构的概述

2.4 本章小节

第三章特征提取

3.1 音频特征

3.2 MFCC系数

3.3 GFCC系数

3.4 小波子带能量系数

3.5 改进的特征参数

3.6 本章小结

第四章支持向量机

4.1 线性分类

4.2 核与支持向量机

4.2.1 非线性分类

4.2.2 核函数

4.3 多类分类

4.3.1 一对一分类

4.3.2 一对多分类

4.4 小结

第五章实验与结果分析

5.1 实验条件

5.2 声音事件的检测

5.2.1 实验设计与声音事件分析

5.3 声音的识别

5.3.1 相关参数的设定

5.3.2 基于SVM模型的识别结构

5.3.3 实验结果与分析

5.4 小结

总结与展望

参考文献

致谢

个人简历及在校期间发表的学术论文

基于多层能量检测的动物声音检测与识别

论文摘要

论文目录

相关论文文献

猜你喜欢