
论文摘要
随着计算机技术、网络技术和通讯技术的不断发展,图像、视频、音频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式,其中音频信息占有很重要的地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,缺乏内容语义的描述和结构化的组织,给音频信息的深度处理和分析工作带来了很大的困难。如何提取音频中的结构化信息和内容语义是音频信息深度处理、基于内容检索和辅助视频分析等应用的关键。音频分类技术是解决这一问题的关键技术,是音频结构化的基础。本文在认真总结前人研究成果的基础上,研究了音频结构、音频特征分析与抽取、基于支持向量机的音频分类器和如何确定径向基内核的最佳参数。着重讨论了径向基参数对分类器结果的影响,并提出了基于支持向量机的集成学习分类器算法(ESL-SVM)。本文工作和研究方向主要包括以下几个方面:1.研究了音频的短时处理技术,在此基础上分析了音频的语义内容,引用了不同层次音频结构单元的定义。详细说明了音频分类技术的基本原理,描述了音频分类的流程图。2.从音频帧层次和音频段层次上深入研究了不同类别音频之间的区别性特征,并分别提取相关的特征,通过加权的方式取得特征集。深入研究了支持向量机的原理和分类器的构成,并研究了如何用交叉检测和网格查询的方法确定径向基内核的最佳参数。3.深入研究了径向基参数对分类器结果的影响,在此基础上引入了集成学习的思想,提出了基于支持向量机的集成学习分类器算法(ESL-SVM)。分类器算法是实现音频分类的核心问题,论文通过实验数据证明了ESL-SVM算法的有效性。
论文目录
提要第一章 绪论1.1 引言1.2 音频分类技术的研究现状1.3 课题来源1.4 课题主要研究内容第二章 音频分类技术及原理2.1 音频短时处理技术2.2 音频分类技术2.3 关于音频特征分析与提取2.4 分类器设计的常用方法第三章 基于支持向量机的音频分类3.1 音频信号的处理3.1.1 音频信号的预处理3.1.2 音频信号特征提取3.1.2.1 基于音频帧的特征3.1.2.2 基于音频段的特征3.1.2.3 音频特征集构成3.2 统计学习理论与支持向量机3.2.1 支持向量机的特点3.2.2 支持向量机的应用3.2.3 支持向量机的算法原理3.2.3.1 支持向量机相关概念3.2.3.2 支持向量机的构造3.2.4 支持向量机分类器的改进第四章 基于支持向量机的集成学习音频分类4.1 集成学习4.1.1 集成学习的概念4.1.2 集成学习的分类4.2 AdaBoost 算法4.3 基于支持向量机的集成学习分类算法第五章 系统的设计与实现5.1 音频分类系统的设计5.2 音频分类系统的具体实现5.2.1 音频预处理及特征提取子系统5.2.2 集成学习训练子系统5.2.3 音频分类子系统5.3 实验环境5.4 实验结果5.4.1 支持向量机算法和几种常用分类算法的比较5.4.2 集成学习算法和支持向量机算法的比较第六章 总结和展望6.1 本文内容总结6.2 今后工作与展望参考文献摘要Abstract致谢
相关论文文献
标签:音频分类论文; 音频特征抽取论文; 支持向量机论文; 集成学习论文;