基于内容的MP3音乐检索研究和实现

基于内容的MP3音乐检索研究和实现

论文摘要

基于内容的音乐检索就是把音乐本身的内涵,如节奏、旋律、和弦、伴奏音型、音色等,作为查询条件,对一个由不同格式的音频媒体(如MIDI、MP3或其它格式的波形音乐)所构成的音乐数据库实施查询检索以获取数据库中满足查询条件或包含相同或相似音乐片段的音乐资源。这些表征不同音乐内涵的查询条件可以通过哼唱或借助现有的乐谱输入工具输入到检索系统中以实施检索。本论文对基于内容的MP3音乐检索技术进行了研究,并实现了一个灵活的具有多种查询音乐输入方式的MP3音乐检索原型系统。目前,大部分基于内容的音乐检索系统所检索的对象都是MIDI音乐,对MP3音乐检索的研究相对来说比较少,并且查询音乐的输入方式也大都比较单一。鉴于不同的用户具备不同的音乐素养及拥有不同的查询音乐资源,本论文提出了在MP3音乐检索系统中引入多种查询音乐输入方式,包括五线谱输入方式、类简谱输入方式、哼唱输入方式、单音色且单声部的MP3音乐文件输入方式和多声部的MP3音乐文件输入方式。而由于当前对波形音乐的音高辨识技术的研究还不够成熟,且用户在哼唱输入时对音准和旋律节奏也并非能准确把握,这都使得系统最终获得的查询旋律特征与用户所期望的查询旋律会存在一定的差距,自然影响到检索的准确性。为此,本论文还提出通过多种交互手段使用户可以根据自己的音乐能力来判断和校正系统所获取的音乐旋律特征,以进一步提高检索的准确性和增强系统的可用性。在检索匹配多声部MP3音乐数据库的实现技术上,本论文针对单音色、单声部音乐和多声部音乐这两种类型的查询音乐的不同特点分别使用了不同的匹配方法。对于前者,本论文提出了一种包含休止符归并和长音分段的二次规整匹配新算法,并通过原型系统进行了实验模拟分析,证明了该算法的有效性。对于后者,本论文将Jeremy(2004)提出的基于和声模型的多声部MIDI音乐检索多声部MIDI音乐数据库的技术推广到使用多声部MP3音乐片段检索多声部MP3音乐数据库,分别构建了HMM和声模型和Markov和声模型两种检索模型,实验结果表明这两个模型都具有一定的实用价值。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究目的及意义
  • 1.2 相关的工作
  • 1.2.1 针对音乐类数据的检索
  • 1.2.2 针对一般音频数据的检索
  • 1.3 关键技术
  • 1.4 本论文研究的主要内容和创新点
  • 1.4.1 问题的提出
  • 1.4.2 研究内容
  • 1.4.3 主要创新点和特色
  • 1.5 论文的结构
  • 第二章 MP3音乐格式分析和旋律特征抽取
  • 2.1 MP3的音乐格式分析及编解码算法
  • 2.1.1 MPEG概述
  • 2.1.2 MP3编码原理
  • 2.1.3 MP3帧格式
  • 2.1.4 MP3解码算法
  • 2.2 旋律特征提取
  • 2.2.1 小波低通滤波
  • 2.2.2 基频提取分析和音符识别
  • 2.2.2.1 FFT变换
  • 2.2.2.2 频谱分析和基频提取
  • 2.2.2.3 音高名识别和多声部音乐的旋律特征表示
  • 2.2.3 人声哼唱和其它单声部波形音乐的旋律特征抽取
  • 2.3 本章小结
  • 第三章 单声部音乐检索的二次规整匹配算法
  • 3.1 类简谱
  • 3.1.1 类简谱音高序列
  • 3.1.2 类简谱音长序列
  • 3.2 单声部查询音乐的类简谱表示
  • 3.2.1 类简谱查询向量
  • 3.2.2 五线谱输入的类简谱查询向量表示
  • 3.3 检索和匹配过程
  • 3.3.1 设计思想
  • 3.3.2 具体算法
  • 3.4 本章小结
  • 第四章 多声部音乐检索的和声模型
  • 4.1 Markov模型和隐Markov模型简介
  • 4.1.1 Markov模型
  • 4.1.2 隐Markov模型的基本概念和定义
  • 4.1.3 隐Markov模型的三个基本问题
  • 4.1.4 隐Markov模型的基本算法
  • 4.1.4.1 前向-后向算法
  • 4.1.4.2 Viterbi算法
  • 4.2 和弦特征
  • 4.2.1 和声和和弦的基本概念
  • 4.2.2 和弦词典
  • 4.2.3 和声判定和共时向量
  • 4.3 HMM和声模型
  • 4.3.1 HMM和声模型的定义
  • 4.3.2 HMM和声模型的训练
  • 4.3.2.1 π和A的初始化
  • 4.3.2.2 B的初始化
  • 4.3.3 查询检索
  • 4.4 Markov和声模型
  • 4.4.1 部分观察
  • 4.4.2 Markov和声模型的训练
  • 4.4.3 查询检索
  • 4.5 本章小结
  • 第五章 系统设计与实现
  • 5.1 系统结构设计
  • 5.2 输入查询处理模块
  • 5.2.1 五线谱输入方式
  • 5.2.2 直接类简谱输入方式
  • 5.2.3 哼唱输入方式
  • 5.2.4 单声部MP3音乐文件(或波形文件)输入方式
  • 5.2.5 多声部MP3音乐文件(或波形文件)输入方式
  • 5.3 实验及结果分析
  • 5.3.1 五线谱和直接类简谱输入查询
  • 5.3.2 哼唱输入查询
  • 5.3.3 单音色、单声部的非哼唱音乐输入查询
  • 5.3.4 多声部音乐检索的和声模型
  • 5.4 本章小结
  • 第六章 总结与展望
  • 6.1 全文总结
  • 6.2 今后的工作
  • 附录
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].基于图像的手势识别 MP3播放器的应用[J]. 桂林航天工业学院学报 2020(02)
    • [2].环绕声与MP3环绕声浅析[J]. 北方音乐 2015(23)
    • [3].基于单片机的红外遥控MP3设计[J]. 淮海工学院学报(自然科学版) 2011(01)
    • [4].MP3壳体注射模设计[J]. 模具制造 2010(09)
    • [5].为什么都说MP3已死?其实它是重获新生[J]. 商业文化 2017(16)
    • [6].MP3产品设计的艺术分析[J]. 包装工程 2008(09)
    • [7].一种改进的MP3被动篡改定位检测算法[J]. 信息网络安全 2014(10)
    • [8].论MP3搜索引擎的侵权责任认定[J]. 哈尔滨学院学报 2009(06)
    • [9].一种基于数字水印的MP3作品版权保护的实现[J]. 信息技术 2015(11)
    • [10].基于S3C2410的嵌入式多通道MP3的研究与设计[J]. 工业控制计算机 2010(09)
    • [11].MP3压缩域中语音分割的研究与实现[J]. 计算机应用 2009(04)
    • [12].MP3未来在哪 由高清热引起的反思[J]. 电脑迷 2009(13)
    • [13].基于压缩域的MP3音频数字水印算法[J]. 计算机工程 2011(10)
    • [14].基于MP3播放器及数码录音笔的音频信号源[J]. 自动化技术与应用 2012(10)
    • [15].支持多种存储介质的嵌入式MP3播放系统的设计与实现[J]. 计算机系统应用 2008(01)
    • [16].MP3搜索引擎服务商的法律责任——对“百度案”和“雅虎案”二审判决的评析[J]. 电子知识产权 2008(08)
    • [17].应用电子技术专业《MP3播放器制作》项目教学设计与实施[J]. 河南科技 2014(05)
    • [18].针对MP3压缩域比例因子的音频水印算法[J]. 计算机工程与应用 2012(27)
    • [19].刍议MP3音乐下载中的著作权问题[J]. 法制与社会 2011(17)
    • [20].新款手机瞄准MP3用户[J]. TWICE消费电子商讯 2008(02)
    • [21].车载MP3的系统设计[J]. 山西电子技术 2009(06)
    • [22].母亲与MP3[J]. 当代护士(综合版) 2009(02)
    • [23].数字音乐(MP3)网络服务者的著作权侵权责任[J]. 商业文化(上半月) 2011(11)
    • [24].发短信赢MP3——《可乐》短信平台[J]. 可乐 2008(06)
    • [25].柑桔园链格孢菌Mp3毒素作用机制研究[J]. 中国南方果树 2012(03)
    • [26].MP3压缩域音频的数字水印算法[J]. 太原师范学院学报(自然科学版) 2011(04)
    • [27].大容量移动硬盘MP3播放器的硬件设计[J]. 淮阴工学院学报 2009(01)
    • [28].一种基于单片机的MP3音频播放器设计[J]. 电子设计工程 2016(06)
    • [29].发短信赢MP3——《可乐》短信平台[J]. 可乐 2008(08)
    • [30].与时长相关的相同码率MP3双压缩检测方法[J]. 计算机工程与应用 2017(11)

    标签:;  ;  ;  

    基于内容的MP3音乐检索研究和实现
    下载Doc文档

    猜你喜欢