Print

基于内容的多声道音频检索系统开发

论文摘要

现有网上音乐检索局限于类浏览和基于文字的查找功能。为了寻找一首乐曲,用户必需准确地知道标题、作者、演奏家或者其他相关的文字描述,否则就只能花费大量时间,逐一浏览这个音乐分类下的所有乐曲。这种基于文本的信息检索方式,脱离实际音乐检索需要很远。例如哼起一首歌曲的主旋律却想不起歌名,很难通过传统的方法来找到乐曲。这就需要通过对音乐本身特征的识别,实现基于内容的音乐检索。近年来,基于内容的音频检索技术成为热点课题,对单声道音频的旋律特征提取算法,国外不少研究机构已有卓越贡献,并开发出基于音频感知特征的音频检索商业化引擎。我国港台地区学者改进国外已有理论和方法,取得进展。国内相关研究项目也不少,其成果比国外和港台同类研究还有差距。本论文工作内容是多声道音频的基于内容的旋律识别与检索。单声道的MIDI文件可以按时间延续信息按顺序提取,多声道的MIDI音乐文件的处理则要复杂的多。在乐理知识基础上分析多声道音频的旋律特征识别、表达方式,改进提取算法,适应多声道处理。设计面向多声道MIDI格式文件作为音乐旋律的数据源,构建基于内容的音频检索系统,通过人的哼唱即可检索乐曲。另外,还探索了WAV格式音乐旋律的数据源的系统。设计的有效性已通过原型系统实验室运行证实。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.2 基于内容的音频检索技术的研究现状
  • 1.3 本论文的主要研究内容
  • 第二章 基于内容的音频检索
  • 2.1 基于内容的音频检索模型总体设计
  • 2.1.1 哼唱旋律特征的提取和表达
  • 2.1.2 基于内容的音频检索系统层次设计
  • 2.2 基本乐理知识及音频数据分析
  • 2.2.1 音乐乐理基础
  • 2.2.1.1 音乐的音高表示—音名
  • 2.2.1.2 国际标准音高
  • 2.2.1.3 音高的距离—音程及其表示方法
  • 2.2.1.4 律制及其选择
  • 2.2.2 音频信息特征
  • 2.2.3 常用音频文件格式的比较
  • 2.2.4 MIDI 格式音频文件提取音乐旋律的优点
  • 第三章 哼唱的旋律识别和特征提取
  • 3.1 哼唱输入预处理
  • 3.2 音符切分
  • 3.3 旋律特征提取
  • 3.4 旋律轮廓表示
  • 第四章 给定音频文件的旋律识别和特征提取
  • 4.1 给定音乐文件旋律表示法及旋律信息提取研究
  • 4.2 MIDI 格式详解
  • 4.3 MIDI 音乐文件旋律信息的提取
  • 4.4 WAV 格式详解
  • 4.5 WAV 数字音乐文件的旋律信息的提取
  • 第五章 基于内容的音频检索系统实现
  • 5.1 基于内容的音频检索系统哼唱部分实现
  • 5.2 基于内容的音频检索系统总体实现
  • 5.2.1 数据库系统设计
  • 5.2.2 系统实现界面
  • 5.2.2.1 检索模块实现
  • 5.2.2.2 音乐库模块实现
  • 5.2.2.3 工具模块实现
  • 5.3 旋律特征的匹配检索
  • 5.4 系统运行结果
  • 第六章 结论与展望
  • 6.1 结论
  • 6.2 展望
  • 参考文献
  • 致谢
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/5bcf4a53c962a49c28d4f94e.html