基于内容的多声道音频检索系统开发

论文摘要

现有网上音乐检索局限于类浏览和基于文字的查找功能。为了寻找一首乐曲，用户必需准确地知道标题、作者、演奏家或者其他相关的文字描述，否则就只能花费大量时间，逐一浏览这个音乐分类下的所有乐曲。这种基于文本的信息检索方式，脱离实际音乐检索需要很远。例如哼起一首歌曲的主旋律却想不起歌名，很难通过传统的方法来找到乐曲。这就需要通过对音乐本身特征的识别，实现基于内容的音乐检索。近年来，基于内容的音频检索技术成为热点课题，对单声道音频的旋律特征提取算法，国外不少研究机构已有卓越贡献，并开发出基于音频感知特征的音频检索商业化引擎。我国港台地区学者改进国外已有理论和方法，取得进展。国内相关研究项目也不少，其成果比国外和港台同类研究还有差距。本论文工作内容是多声道音频的基于内容的旋律识别与检索。单声道的MIDI文件可以按时间延续信息按顺序提取，多声道的MIDI音乐文件的处理则要复杂的多。在乐理知识基础上分析多声道音频的旋律特征识别、表达方式，改进提取算法，适应多声道处理。设计面向多声道MIDI格式文件作为音乐旋律的数据源，构建基于内容的音频检索系统,通过人的哼唱即可检索乐曲。另外，还探索了WAV格式音乐旋律的数据源的系统。设计的有效性已通过原型系统实验室运行证实。

论文目录

摘要

Abstract

第一章绪论

1.1 研究背景和意义

1.2 基于内容的音频检索技术的研究现状

1.3 本论文的主要研究内容

第二章基于内容的音频检索

2.1 基于内容的音频检索模型总体设计

2.1.1 哼唱旋律特征的提取和表达

2.1.2 基于内容的音频检索系统层次设计

2.2 基本乐理知识及音频数据分析

2.2.1 音乐乐理基础

2.2.1.1 音乐的音高表示—音名

2.2.1.2 国际标准音高

2.2.1.3 音高的距离—音程及其表示方法

2.2.1.4 律制及其选择

2.2.2 音频信息特征

2.2.3 常用音频文件格式的比较

2.2.4 MIDI 格式音频文件提取音乐旋律的优点

第三章哼唱的旋律识别和特征提取

3.1 哼唱输入预处理

3.2 音符切分

3.3 旋律特征提取

3.4 旋律轮廓表示

第四章给定音频文件的旋律识别和特征提取

4.1 给定音乐文件旋律表示法及旋律信息提取研究

4.2 MIDI 格式详解

4.3 MIDI 音乐文件旋律信息的提取

4.4 WAV 格式详解

4.5 WAV 数字音乐文件的旋律信息的提取

第五章基于内容的音频检索系统实现

5.1 基于内容的音频检索系统哼唱部分实现

5.2 基于内容的音频检索系统总体实现

5.2.1 数据库系统设计

5.2.2 系统实现界面

5.2.2.1 检索模块实现

5.2.2.2 音乐库模块实现

5.2.2.3 工具模块实现

5.3 旋律特征的匹配检索

5.4 系统运行结果

第六章结论与展望

6.1 结论

6.2 展望

参考文献

致谢

基于内容的多声道音频检索系统开发

论文摘要

论文目录

相关论文文献