音乐结构自动分析研究

音乐结构自动分析研究

论文摘要

音乐是目前音频处理领域重要的研究对象之一,其是多种可感知信息的良好载体。而音乐结构是音乐组织表达信息的一种表现手段,对它的分析是理解音乐的重要途径之一,是目前音乐检索技术的热点之一。本文从两个角度将流行音乐的结构分为前奏(intro)、主歌(verse)、副歌(chorus)、过门音乐(bridge)和结尾(outro)五部分。一个角度是流行音乐中人声的识别;另一角度是基于相似性矩阵的流行音乐结构分析。由于除了主歌、副歌,其他部分基本都是纯音乐组成,因此流行音乐中人声的识别对于流行音乐的结构分析有着很大的辅助作用。对于此问题,我们使用SVM分类器针对MFCC特征进行训练和分类,基于音频连续性的考虑,后期对于分类结果低通滤波,使识别率平均提高11.9%。实验结果表明,在帧的基础上识别率可以达到85.76%。相似性矩阵将处理一维的音频问题转化为处理二维图像的问题,其中由于主歌和副歌在音乐中会重复出现,所以两者在相似性矩阵图像中呈现为一些水平直线,这样将问题转化为图像中直线的发现问题。这里我们把这样一个灰度图像内的直线发现问题从反问题的角度来考虑。这里的反问题是建立在拉东变换的基础上。这样做的优点是我们可以从一个正规化的框架内来解决这个问题,而正规化可以比较自然的结合先验知识,从而提高基于拉东变换的直线检测方法的性能。这样,我们通过流行音乐中人声的识别确定了intro、bridge和outro的位置,通过基于相似性矩阵的流行音乐的结构分析确定了verse和chorus的位置。最后综合两方面的结果,完成流行音乐的结构分析工作。流行音乐中的副歌(高潮)检出(chorus detection)是MIR领域中一个重要的问题,本文给出的流行音乐的结构分析不仅给出了音乐中副歌的位置,同时给出音乐中其他具有代表性的乐段的位置。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究现状
  • 1.3 歌曲结构分析框架
  • 1.4 本文的研究内容
  • 第2章 基本音乐理论和歌曲结构
  • 2.1 基本音乐理论
  • 2.1.1 音高和时长
  • 2.1.2 调式与调性
  • 2.1.3 旋律
  • 2.2 歌曲结构理论
  • 2.2.1 流行歌曲背景知识
  • 2.2.2 流行歌曲的结构
  • 2.3 歌曲结构信息的图形化表示
  • 2.3.1 特征选取
  • 2.3.2 相似性矩阵
  • 2.4 本章小结
  • 第3章 流行音乐中人声的识别
  • 3.1 引言
  • 3.2 基于SVM 的人声的识别
  • 3.2.1 支持向量机简介
  • 3.2.2 人声识别
  • 3.3 音频数据库及系统整体框架
  • 3.3.1 音频数据库
  • 3.3.2 系统整体框架
  • 3.4 实验结果及分析
  • 3.5 本章小结
  • 第4章 相似性矩阵中直线检测研究
  • 4.1 直线检测算法
  • 4.1.1 问题的形式化
  • 4.1.2 正规化子的选择
  • 4.1.3 正规化问题的算法
  • 4.1.4 前面某些论断的证明
  • 4.2 实验
  • 4.3 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 简历
  • 相关论文文献

    • [1].基于SVM的流行音乐中人声的识别[J]. 计算机工程与应用 2008(25)

    标签:;  ;  ;  ;  ;  

    音乐结构自动分析研究
    下载Doc文档

    猜你喜欢