基于支持向量机的集成学习音频分类算法

论文摘要

随着计算机技术、网络技术和通讯技术的不断发展,图像、视频、音频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式,其中音频信息占有很重要的地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,缺乏内容语义的描述和结构化的组织,给音频信息的深度处理和分析工作带来了很大的困难。如何提取音频中的结构化信息和内容语义是音频信息深度处理、基于内容检索和辅助视频分析等应用的关键。音频分类技术是解决这一问题的关键技术,是音频结构化的基础。本文在认真总结前人研究成果的基础上,研究了音频结构、音频特征分析与抽取、基于支持向量机的音频分类器和如何确定径向基内核的最佳参数。着重讨论了径向基参数对分类器结果的影响,并提出了基于支持向量机的集成学习分类器算法（ESL-SVM）。本文工作和研究方向主要包括以下几个方面:1.研究了音频的短时处理技术,在此基础上分析了音频的语义内容,引用了不同层次音频结构单元的定义。详细说明了音频分类技术的基本原理,描述了音频分类的流程图。2.从音频帧层次和音频段层次上深入研究了不同类别音频之间的区别性特征,并分别提取相关的特征,通过加权的方式取得特征集。深入研究了支持向量机的原理和分类器的构成,并研究了如何用交叉检测和网格查询的方法确定径向基内核的最佳参数。3.深入研究了径向基参数对分类器结果的影响,在此基础上引入了集成学习的思想,提出了基于支持向量机的集成学习分类器算法（ESL-SVM）。分类器算法是实现音频分类的核心问题,论文通过实验数据证明了ESL-SVM算法的有效性。

论文目录

提要

第一章绪论

1.1 引言

1.2 音频分类技术的研究现状

1.3 课题来源

1.4 课题主要研究内容

第二章音频分类技术及原理

2.1 音频短时处理技术

2.2 音频分类技术

2.3 关于音频特征分析与提取

2.4 分类器设计的常用方法

第三章基于支持向量机的音频分类

3.1 音频信号的处理

3.1.1 音频信号的预处理

3.1.2 音频信号特征提取

3.1.2.1 基于音频帧的特征

3.1.2.2 基于音频段的特征

3.1.2.3 音频特征集构成

3.2 统计学习理论与支持向量机

3.2.1 支持向量机的特点

3.2.2 支持向量机的应用

3.2.3 支持向量机的算法原理

3.2.3.1 支持向量机相关概念

3.2.3.2 支持向量机的构造

3.2.4 支持向量机分类器的改进

第四章基于支持向量机的集成学习音频分类

4.1 集成学习

4.1.1 集成学习的概念

4.1.2 集成学习的分类

4.2 AdaBoost 算法

4.3 基于支持向量机的集成学习分类算法

第五章系统的设计与实现

5.1 音频分类系统的设计

5.2 音频分类系统的具体实现

5.2.1 音频预处理及特征提取子系统

5.2.2 集成学习训练子系统

5.2.3 音频分类子系统

5.3 实验环境

5.4 实验结果

5.4.1 支持向量机算法和几种常用分类算法的比较

5.4.2 集成学习算法和支持向量机算法的比较

第六章总结和展望

6.1 本文内容总结

6.2 今后工作与展望

参考文献

摘要

Abstract

致谢

基于支持向量机的集成学习音频分类算法

论文摘要

论文目录

相关论文文献

猜你喜欢