论文摘要
在基于旋律的检索机制中,主要研究的内容是旋律的特征提取、特征表示以及特征匹配引擎,在目前的研究中,旋律匹配高速化算法以及旋律模型的鲁棒性建模方面已取得了一定的成绩。本文的研究是围绕基于内容的音乐检索技术进行展开的,旨在实现较高检索精度的基础上,提高检索的效率。本文的主要工作涉及了语音信号处理、MIDI主旋律提取、模式识别、数据挖掘等领域的相关技术。研究的主要内容包括MIDI格式音乐的主旋律提取、哼唱波形文件的特征提取、特征数据库聚类以及旋律匹配问题等。围绕上述研究内容开展了以下研究工作:1.搜集MIDI格式乐曲并分析其格式信息,对多音轨MIDI乐曲进行主旋律提取,将提取的旋律特征数据存储为特征数据库,该方法为乐曲库的聚类分析和检索匹配提供了数据支持。2.针对哼唱旋律特征提取的方法,就时域分析法和频域分析法做了补充实验,并将基于Matlab环境下提取的特征数据调用到VS环境下,该做法改善了原系统的操作性能,为后续研究提供了实用性较强的实验环境。3.在数据挖掘技术中,聚类方法常用于对海量数据的分析研究中。为使本文匹配检索效率提高,本文根据对音频聚类算法的研究分析以及对两级匹配算法的认识,提出了在乐曲匹配检索之前将数据库进行自动分组的单侧连续匹配聚类算法,实验证明该方法可以在提高检索效率的基础上,保证检索的准确度。4.最后,结合特征聚类算法和线性对其匹配算法,设计实现了一个基于旋律的音乐检索测试系统,并通过不同测试,对实验数据进行分析和评价,验证了本文聚类算法的性能优势以及检索的准确性。本文围绕MIDI主旋律提取、旋律特征数据的聚类、旋律的检索匹配以及哼唱检索系统的搭建等四个主要问题进行研究,重点研究了对旋律信息的特征聚类和旋律的匹配算法;提出了具有较强容差性的基于单侧连续匹配的聚类算法,实现了候选歌集的优化;测试实验表明该方法明显降低了检索匹配所需的实际时间,为大规模乐曲数据库的哼唱检索提供了有参考价值的数据支持,并为基于内容的多媒体检索提供了新的实现途径。