基于内容的音频检索特征提取技术研究

基于内容的音频检索特征提取技术研究

论文摘要

随着现代信息技术、多媒体技术和网络技术的迅速发展,多媒体信息的数据量急剧增多。为了充分利用已有的音频信息资源,基于内容的音频信息检索技术受到越来越多的关注。基于内容的音频检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义。整个基于内容的音频检索系统可以分成两大部分,一是音频特征提取,二是音频特征搜索。由于音频特征搜索主要依靠特征提取得来的数据,本文将主要围绕基于内容音频检索特征提取技术展开研究工作。本文首先介绍了基于内容的音频检索系统框架以及相关的特点难点,然后说明了该系统框架内语音平台上人声哼唱特征处理流程。接下来在乐音平台上,本文结合音频信号的相关特征,分别基于时域和频域对有背景音乐的歌曲进行研究分析,提出了三个新的乐音基音特征提取方法。前两种方法是时域上的基音提取算法,是在前人的研究成果上做的改进,从而进一步提高乐音基音特征提取的准确率;第一种是基于音阶的时域乐音基音特征提取方法,该算法引入乐理音阶的属性,通过对于浊音能量模型的建立和研究,选择了峰值滤波器滤取各倍频点能量值进行比较判决,解决了平均幅度差函数(AMDF)算法提取效率不高的问题;第二种算法以人声特征着眼,结合简化逆滤波算法(SIFT),以开环-闭环基音提取为框架进一步提高基音提取的准确率。第三种则是通过对MP3解码过程中频域上数据的特征研究,提出的一种崭新的直接在频域上提取基音的算法,具有更大的应用前景。其与时域基音提取算法具有不相上下的提取效果。本论文为基于内容的音频检索特征提取工作提供了一定的研究思路,对进一步的深入研究具有借鉴意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 研究问题的提出
  • 1.2 基于内容的音频检索研究现状
  • 1.3 论文的主要研究问题和论文结构
  • 第二章 音频特征提取与检测系统
  • 2.1 声音特性概述
  • 2.1.1 声音的感知属性
  • 2.1.2 语音基础特征
  • 2.1.3 音频信号时域与频域的重要特征
  • 2.2 基于内容音频检索总体框架图
  • 2.3 基于内容音频检索难点
  • 2.4 基于内容音频检索系统评测指标
  • 2.4.1 评价指标
  • 2.4.2 音频数据库
  • 2.5 本章小结
  • 第三章 时域音频信号特征提取与表达
  • 3.1 一般情况下时域音频基音特征提取方法
  • 3.1.1 音频信号的预处理
  • 3.1.2 音频信号的基音提取
  • 3.2 语音平台信号的基音特征提取
  • 3.3 一种新的基于音阶的乐音基音特征提取方法
  • 3.3.1 传统AMDF算法
  • 3.3.2 改进AMDF算法
  • 3.4 一种新的从乐音伴奏中提取人声基音的提取方法
  • 3.4.1 线性预测原理
  • 3.4.2 简化逆滤波法
  • 3.4.3 从音乐伴奏中提取人声基音的方法
  • 3.5 本章小结
  • 第四章 频域音频信号特征提取与表达
  • 4.1 MP3 音频格式
  • 4.2 MP3 解码过程中进行基音提取的位置选取
  • 4.3 MP3 中的时频变换
  • 4.3.1 分析子带滤波器与综合子带滤波器
  • 4.3.2 MDCT分析和IMDCT分析
  • 4.4 一种新的频域音频信号特征提取方法
  • 4.5 本章小结
  • 第五章 基于内容音频检索系统实现
  • 5.1 系统功能
  • 5.2 硬件系统平台
  • 5.3 系统特点
  • 5.4 平台结果
  • 5.5 系统改进
  • 5.6 本章小结
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的学术论文目录
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于内容的音频检索特征提取技术研究
    下载Doc文档

    猜你喜欢