基于哼唱的MP3音乐检索研究

基于哼唱的MP3音乐检索研究

论文摘要

随着数字科技的发展,MP3凭借极高的压缩比与极小的失真,成为目前最受欢迎的数字音乐压缩格式,广泛在网络上流行。从大量的MP3音乐资料中检索出自己想要的歌曲,目前只能通过查询歌曲名或歌手名等信息进行检索。如果仅仅是知道一个曲调,就无法搜索到自己想要的歌曲。本文针对这种现况,主要对MP3音乐的哼唱检索进行了研究,使用户只要通过麦克风哼唱一首乐曲的旋律片段,就可以得到所要检索的MP3音乐。目前对哼唱检索系统的研究大部分都是对MIDI格式的检索,对MP3格式的处理研究的较少,另外对哼唱的要求多数是要求用特殊的哼唱方式,对于连续哼唱和带歌词哼唱研究较少。即使采用了连续哼唱的方式,也是提取出旋律轨迹信息后,使用用字符表示法表示,用字符匹配法进行匹配。在对哼唱信号的基频提取上,多数研究使用传统的方法对哼唱输入信号进行基频提取,在提取的过程中会出现种种的问题,对旋律轨迹的准确性造成一定程度的影响。由于连续哼唱方式下旋律轨迹数据量大,所以需要设计一个快速的旋律匹配算法进行旋律匹配计算。针对上面的问题,本文进行了如下的工作:在哼唱输入信号的特征提取模块中,对传统的基频提取算法进行了研究,发现了传统的基频提取算法中存在着各种各样的问题,针对要处理的带歌词哼唱和不带歌词哼唱两种哼唱输入信号,提出了一种小波变换结合自相关函数法对哼唱输入信号进行分析,提取基频轨迹的方法;在MP3旋律特征库的建立上,考虑到一首歌曲中最令人难忘的部分是人声演唱部分,所以首先对MP3音乐进行了预处理,将音乐中的人声信息提取出来,然后将人声部分的MP3音乐进行解码,在解码过程中提取基频;提出了一种精确音程表示法来表示旋律轮廓,使用音程表示法表示MP3旋律轮廓,并根据旋律轮廓建立MP3的旋律特征数据库;在旋律匹配检索模块中,提出了一种数值索引的方式,对旋律特征库中的音程信息建立索引,优化了动态时间规整(Dynamic Time Warping,DTW)算法;设计了一个基于哼唱的MP3音乐检索系统,针对各个模块进行实验模拟分析,证明了提出方法的有效性。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究目的及意义
  • 1.2 国内外研究现状
  • 1.3 基本乐理知识
  • 1.4 哼唱检索需要解决的问题
  • 1.5 本文研究的主要内容
  • 2 哼唱信号基频轨迹提取技术
  • 2.1 引言
  • 2.2 传统的基频提取方法
  • 2.2.1 自相关函数法
  • 2.2.2 平均幅度差函数法
  • 2.2.3 倒谱法
  • 2.2.4 小波变换法
  • 2.2.5 基音检测的后处理
  • 2.3 小波分析用于基频提取
  • 2.3.1 小波分析基本理论
  • 2.3.2 传统基频提取方法存在的问题
  • 2.3.3 小波变换与自相关结合基频提取法
  • 2.4 本章小结
  • 3 MP3音乐信息的分析与特征表示
  • 3.1 MPEG概述
  • 3.2 MP3的音乐格式分析
  • 3.2.1 MP3的编码技术
  • 3.2.2 MP3的帧格式
  • 3.2.3 MP3音乐的解码算法
  • 3.3 MP3音乐的基频提取与特征表示
  • 3.3.1 MP3音乐的预处理
  • 3.3.2 MP3音乐的基频提取
  • 3.4 本章小结
  • 4 基于数值索引的DTW检索算法研究
  • 4.1 基于DTW的音乐检索算法
  • 4.1.1 DTW算法介绍
  • 4.1.2 基于DTW的音乐检索算法的缺陷
  • 4.2 改进的音乐旋律表示法
  • 4.3 基于数值索引的DTW音乐检索算法
  • 4.3.1 数值索引方法
  • 4.3.2 基于数值索引的DTW检索算法
  • 4.4 本章小结
  • 5 系统设计及实验分析
  • 5.1 系统结构设计
  • 5.2 哼唱特征提取模块
  • 5.2.1 本文基频提取方法与传统自相关方法比较
  • 5.2.2 哼唱输入信号特征提取
  • 5.3 MP3音乐旋律的特征表示
  • 5.4 DTW匹配算法实验
  • 5.5 本章小结
  • 6 结论与展望
  • 6.1 本文结论
  • 6.2 研究展望
  • 参考文献
  • 附录A 频率、临界频带率和绝对阈值表
  • 在读期间发表的学术论文
  • 论文刊用通知
  • 作者简历
  • 致谢
  • 相关论文文献

    • [1].基于图像的手势识别 MP3播放器的应用[J]. 桂林航天工业学院学报 2020(02)
    • [2].环绕声与MP3环绕声浅析[J]. 北方音乐 2015(23)
    • [3].基于单片机的红外遥控MP3设计[J]. 淮海工学院学报(自然科学版) 2011(01)
    • [4].MP3壳体注射模设计[J]. 模具制造 2010(09)
    • [5].为什么都说MP3已死?其实它是重获新生[J]. 商业文化 2017(16)
    • [6].MP3产品设计的艺术分析[J]. 包装工程 2008(09)
    • [7].一种改进的MP3被动篡改定位检测算法[J]. 信息网络安全 2014(10)
    • [8].论MP3搜索引擎的侵权责任认定[J]. 哈尔滨学院学报 2009(06)
    • [9].一种基于数字水印的MP3作品版权保护的实现[J]. 信息技术 2015(11)
    • [10].基于S3C2410的嵌入式多通道MP3的研究与设计[J]. 工业控制计算机 2010(09)
    • [11].MP3压缩域中语音分割的研究与实现[J]. 计算机应用 2009(04)
    • [12].MP3未来在哪 由高清热引起的反思[J]. 电脑迷 2009(13)
    • [13].基于压缩域的MP3音频数字水印算法[J]. 计算机工程 2011(10)
    • [14].基于MP3播放器及数码录音笔的音频信号源[J]. 自动化技术与应用 2012(10)
    • [15].支持多种存储介质的嵌入式MP3播放系统的设计与实现[J]. 计算机系统应用 2008(01)
    • [16].MP3搜索引擎服务商的法律责任——对“百度案”和“雅虎案”二审判决的评析[J]. 电子知识产权 2008(08)
    • [17].应用电子技术专业《MP3播放器制作》项目教学设计与实施[J]. 河南科技 2014(05)
    • [18].针对MP3压缩域比例因子的音频水印算法[J]. 计算机工程与应用 2012(27)
    • [19].刍议MP3音乐下载中的著作权问题[J]. 法制与社会 2011(17)
    • [20].新款手机瞄准MP3用户[J]. TWICE消费电子商讯 2008(02)
    • [21].车载MP3的系统设计[J]. 山西电子技术 2009(06)
    • [22].母亲与MP3[J]. 当代护士(综合版) 2009(02)
    • [23].数字音乐(MP3)网络服务者的著作权侵权责任[J]. 商业文化(上半月) 2011(11)
    • [24].发短信赢MP3——《可乐》短信平台[J]. 可乐 2008(06)
    • [25].柑桔园链格孢菌Mp3毒素作用机制研究[J]. 中国南方果树 2012(03)
    • [26].MP3压缩域音频的数字水印算法[J]. 太原师范学院学报(自然科学版) 2011(04)
    • [27].大容量移动硬盘MP3播放器的硬件设计[J]. 淮阴工学院学报 2009(01)
    • [28].一种基于单片机的MP3音频播放器设计[J]. 电子设计工程 2016(06)
    • [29].发短信赢MP3——《可乐》短信平台[J]. 可乐 2008(08)
    • [30].与时长相关的相同码率MP3双压缩检测方法[J]. 计算机工程与应用 2017(11)

    标签:;  ;  ;  ;  ;  

    基于哼唱的MP3音乐检索研究
    下载Doc文档

    猜你喜欢