论文摘要
随着现代信息技术、多媒体技术和网络技术的迅速发展,多媒体信息的数据量急剧增多。为了充分利用已有的音频信息资源,基于内容的音频信息检索技术受到越来越多的关注。基于内容的音频检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义。整个基于内容的音频检索系统可以分成两大部分,一是音频特征提取,二是音频特征搜索。由于音频特征搜索主要依靠特征提取得来的数据,本文将主要围绕基于内容音频检索特征提取技术展开研究工作。本文首先介绍了基于内容的音频检索系统框架以及相关的特点难点,然后说明了该系统框架内语音平台上人声哼唱特征处理流程。接下来在乐音平台上,本文结合音频信号的相关特征,分别基于时域和频域对有背景音乐的歌曲进行研究分析,提出了三个新的乐音基音特征提取方法。前两种方法是时域上的基音提取算法,是在前人的研究成果上做的改进,从而进一步提高乐音基音特征提取的准确率;第一种是基于音阶的时域乐音基音特征提取方法,该算法引入乐理音阶的属性,通过对于浊音能量模型的建立和研究,选择了峰值滤波器滤取各倍频点能量值进行比较判决,解决了平均幅度差函数(AMDF)算法提取效率不高的问题;第二种算法以人声特征着眼,结合简化逆滤波算法(SIFT),以开环-闭环基音提取为框架进一步提高基音提取的准确率。第三种则是通过对MP3解码过程中频域上数据的特征研究,提出的一种崭新的直接在频域上提取基音的算法,具有更大的应用前景。其与时域基音提取算法具有不相上下的提取效果。本论文为基于内容的音频检索特征提取工作提供了一定的研究思路,对进一步的深入研究具有借鉴意义。
论文目录
相关论文文献
标签:基于内容的音频检索论文; 基于哼唱的音乐检索论文; 音频特征论文; 基音论文; 旋律特征论文;