论文摘要
音乐是目前音频处理领域重要的研究对象之一,其是多种可感知信息的良好载体。而音乐结构是音乐组织表达信息的一种表现手段,对它的分析是理解音乐的重要途径之一,是目前音乐检索技术的热点之一。本文从两个角度将流行音乐的结构分为前奏(intro)、主歌(verse)、副歌(chorus)、过门音乐(bridge)和结尾(outro)五部分。一个角度是流行音乐中人声的识别;另一角度是基于相似性矩阵的流行音乐结构分析。由于除了主歌、副歌,其他部分基本都是纯音乐组成,因此流行音乐中人声的识别对于流行音乐的结构分析有着很大的辅助作用。对于此问题,我们使用SVM分类器针对MFCC特征进行训练和分类,基于音频连续性的考虑,后期对于分类结果低通滤波,使识别率平均提高11.9%。实验结果表明,在帧的基础上识别率可以达到85.76%。相似性矩阵将处理一维的音频问题转化为处理二维图像的问题,其中由于主歌和副歌在音乐中会重复出现,所以两者在相似性矩阵图像中呈现为一些水平直线,这样将问题转化为图像中直线的发现问题。这里我们把这样一个灰度图像内的直线发现问题从反问题的角度来考虑。这里的反问题是建立在拉东变换的基础上。这样做的优点是我们可以从一个正规化的框架内来解决这个问题,而正规化可以比较自然的结合先验知识,从而提高基于拉东变换的直线检测方法的性能。这样,我们通过流行音乐中人声的识别确定了intro、bridge和outro的位置,通过基于相似性矩阵的流行音乐的结构分析确定了verse和chorus的位置。最后综合两方面的结果,完成流行音乐的结构分析工作。流行音乐中的副歌(高潮)检出(chorus detection)是MIR领域中一个重要的问题,本文给出的流行音乐的结构分析不仅给出了音乐中副歌的位置,同时给出音乐中其他具有代表性的乐段的位置。
论文目录
相关论文文献
- [1].基于SVM的流行音乐中人声的识别[J]. 计算机工程与应用 2008(25)
标签:流行音乐结构分析论文; 人声发现论文; 支持向量机论文; 直线发现论文; 拉东变换论文;