基于内容的音频检索特征提取技术研究

论文摘要

随着现代信息技术、多媒体技术和网络技术的迅速发展,多媒体信息的数据量急剧增多。为了充分利用已有的音频信息资源,基于内容的音频信息检索技术受到越来越多的关注。基于内容的音频检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义。整个基于内容的音频检索系统可以分成两大部分,一是音频特征提取,二是音频特征搜索。由于音频特征搜索主要依靠特征提取得来的数据,本文将主要围绕基于内容音频检索特征提取技术展开研究工作。本文首先介绍了基于内容的音频检索系统框架以及相关的特点难点,然后说明了该系统框架内语音平台上人声哼唱特征处理流程。接下来在乐音平台上,本文结合音频信号的相关特征,分别基于时域和频域对有背景音乐的歌曲进行研究分析,提出了三个新的乐音基音特征提取方法。前两种方法是时域上的基音提取算法,是在前人的研究成果上做的改进,从而进一步提高乐音基音特征提取的准确率;第一种是基于音阶的时域乐音基音特征提取方法,该算法引入乐理音阶的属性,通过对于浊音能量模型的建立和研究,选择了峰值滤波器滤取各倍频点能量值进行比较判决,解决了平均幅度差函数（AMDF）算法提取效率不高的问题;第二种算法以人声特征着眼,结合简化逆滤波算法（SIFT）,以开环-闭环基音提取为框架进一步提高基音提取的准确率。第三种则是通过对MP3解码过程中频域上数据的特征研究,提出的一种崭新的直接在频域上提取基音的算法,具有更大的应用前景。其与时域基音提取算法具有不相上下的提取效果。本论文为基于内容的音频检索特征提取工作提供了一定的研究思路,对进一步的深入研究具有借鉴意义。

论文目录

摘要

ABSTRACT

第一章引言

1.1 研究问题的提出

1.2 基于内容的音频检索研究现状

1.3 论文的主要研究问题和论文结构

第二章音频特征提取与检测系统

2.1 声音特性概述

2.1.1 声音的感知属性

2.1.2 语音基础特征

2.1.3 音频信号时域与频域的重要特征

2.2 基于内容音频检索总体框架图

2.3 基于内容音频检索难点

2.4 基于内容音频检索系统评测指标

2.4.1 评价指标

2.4.2 音频数据库

2.5 本章小结

第三章时域音频信号特征提取与表达

3.1 一般情况下时域音频基音特征提取方法

3.1.1 音频信号的预处理

3.1.2 音频信号的基音提取

3.2 语音平台信号的基音特征提取

3.3 一种新的基于音阶的乐音基音特征提取方法

3.3.1 传统AMDF算法

3.3.2 改进AMDF算法

3.4 一种新的从乐音伴奏中提取人声基音的提取方法

3.4.1 线性预测原理

3.4.2 简化逆滤波法

3.4.3 从音乐伴奏中提取人声基音的方法

3.5 本章小结

第四章频域音频信号特征提取与表达

4.1 MP3 音频格式

4.2 MP3 解码过程中进行基音提取的位置选取

4.3 MP3 中的时频变换

4.3.1 分析子带滤波器与综合子带滤波器

4.3.2 MDCT分析和IMDCT分析

4.4 一种新的频域音频信号特征提取方法

4.5 本章小结

第五章基于内容音频检索系统实现

5.1 系统功能

5.2 硬件系统平台

5.3 系统特点

5.4 平台结果

5.5 系统改进

5.6 本章小结

第六章总结与展望

参考文献

致谢

攻读硕士学位期间发表的学术论文目录

基于内容的音频检索特征提取技术研究

论文摘要

论文目录

相关论文文献

猜你喜欢