论文摘要
音乐信号分析自20世纪60年代起,一直吸引着众多学者的目光,但是由于技术限制和音乐本身的复杂性,一直都没有得到很好的结果。随着21世纪数字信息技术的发展,许多基于音乐信号分析的应用,例如音乐的自动标注、乐谱转译和音乐检索等,都对分析结果有着较高要求。但是由于音乐信号构成复杂,即使对于完全数字化的信号,至今仍没有较为完善的方法对其进行细致的分析。音乐由乐器产生,准确地讲,是由乐器本身或其部件振动产生。标准乐器产生的声音都有固定的音高,而音高对应的物理概念是其振动的频率。由于记录乐谱和演奏统一性的需要,人们指定了音符与音高的对应关系,即乐音体系。每一种乐音体系都规定了音符对应的频率,这些频率离散分布,有限并有固定的数学关系,因此只要知道了一个标准频率和音符间的数学关系,就可以得到整个乐音体系的所有频率。人耳能听到的频率范围是20Hz-20000Hz,那么在给定乐音体系下,我们能听到的乐音为有限个频率。基于此,我们考虑使用框架理论对乐音信号进行分析。令为乐音频率集合,共有K个:(?)并且(?)再令(?)这里( )是m次B样条函数,则可证得如下定理定理(?)是一组稳定基。(?)具有如下性质:命题令(?)如果(?)在定义域内线性无关,那么(?)在定义域内也线性无关。类似地,令(?)这里(?)是高斯函数,即(?)使用上面的符号,我们有如下定理定理如果一个函数(?)可以被表示成如下形式(?)这里(?)并且存在1 2使得(?)那么(?)是一组稳定基。同理,我们可以证明(?)都是稳定基,这里Φ是B样条函数或高斯函数。我们知道,音频信号可以看作是三角函数的叠加,即音频信号有如下表示(?)其中表示系数集合,表示频率集合。基于上面的结论,我们使用如下两组框架对音频信号进行逼近。高斯框架:(?)B样条框架:(?)这里nm ( )表示次数为m,支集左端点坐标为n的B样条函数。这样我们就得到了逼近问题:若给定音乐信号,选用一组基Φn( )及相应系数n构造,使(?)用去逼近,考虑使用最小二乘法求解问题,即是(?)的解。经化简整理,将问题转化为求解方程组(?)得到n,进而求得。根据框架特点,当样条平移距离相差为2时,矩阵和对应的系数即为0,由此可知和均为带状矩阵,其带宽与局部的频率或音符数成正比,也与样条的阶数成正比。由于高斯函数是速降函数,因此高斯框架形成的和也近似为带状矩阵。用ij和ij分别表示上式算得到的矩阵和的第行第列元素,对元素重新排列,使之具有如下形式(?)由和是带状矩阵,即知上述矩阵为带状矩阵。使用带状矩阵求解方法,可以提高计算速度。进一步,如果我们选用如下框架(?)则原逼近格式改写为(?)经化简整理,可得如下块状周期三对角矩阵(?)可以使用两参数法快速求解。若将逼近函数变形,有(?)这里或者是高斯函数或者是B样条函数。则由上式,令(?)则(?)信号的振幅信息。将时间离散为N个时刻,即v,这样就得到了( )中每个频率在每一时刻的振幅,写成矩阵为(?)矩阵中的第k行表示在第k个时刻音频中每个频率的振幅值。理论上来讲,由单音旋律(任意时刻演奏的音符只有一个)生成的音频信号,经框架逼近后得到的振幅矩阵,其每一行应该只包含一个音符的振幅,也就是构成该音符的基频与泛音的振幅,该时刻不发声的音符所包含的频率的振幅都为零。由乐理知识我们又知道,基频与泛音的不同组合恰好是乐器发声的特质所在,是它可以与其他乐器区分开的标识。因此,如果我们知道某种乐器演奏每个音符时的频率构成,那么对于计算而得的中的行向量来说,其非零元素的组合就反过来对应一个音符,将每行对应的音符得到后,再对连续出现的音符统计其个数,这样就可以得到这段音频信号的音符与音符时长。再经过简单的逻辑转换,就可以得到乐谱。在未知规则的情况下,一种分类的有效工具是支持向量机(SVM)。SVM方法是建立在统计学习理论和VC维理论和结构风险最小原理基础上,根据小样本数据折衷模型复杂性和学习能力,希望达到最好的泛化能力的机器学习方法。由于每种乐器的音色特质,即音符对应的频率构成未知,因此需要我们建立训练数据输入到SVM中建立分类模型。中包含频率和振幅的每一行向量恰好是一个包含音符对应音频信息的特征向量,因此可以输入到SVM中进行训练。为了提高泛化能力,我们对训练音频进行多参数逼近,通过调整Fourier变换阈值,框架平移间距等得到同一音符的不同频率组合。数值实验显示,SVM能很好的识别单音旋律,每一时刻都被正确的分类到音频中出现的频率,没有非音频中的频率被识别出来,因此音符的识别率为100%。但是由于音频信号的衰减性质与弹奏时长的设定,在上一音符即将停止下一音符已经弹奏的这段交叉地带,会有音符得到更多分类情况发生,但所有的分类结果都保持分段常数的性质(即没有两种分类结果交替产生的情况)。与理论预期相比,在采样率为44100情形下时长误差在0.5%-1.6%之间,如果将采样率降低,不仅可以提高分类精度,而且对于拍速200之内的乐曲满足实时处理需求,可以达到输出乐谱需求。本文提出了一种新的逼近信号格式,通过从单一频率层面采集音频信息进而得到信号的精确逼近,统一了逼近格式,将复杂的时频分析转化成信号到矩阵的变换,结合机器学习方法对逼近格式进行检测,提高了自适应性、准确性和检测速度,为音乐自动转谱提供一种切实有效的方法。
论文目录
相关论文文献
- [1].基于SVM的永磁无刷直流电机无位置传感器控制[J]. 电子产品世界 2020(01)
- [2].基于商空间的黄金价格SVM模型预测[J]. 黄金科学技术 2020(01)
- [3].基于主成分降维的SVM回归模型在煤与瓦斯突出预测中的应用[J]. 工业计量 2020(01)
- [4].基于SVM的在线医疗信息服务质量关键影响因素研究[J]. 情报科学 2020(03)
- [5].基于SVM与fMRI技术对精神分裂症的分类研究[J]. 现代计算机 2020(01)
- [6].基于SVM算法的微博评论数据情感分析[J]. 数字通信世界 2020(01)
- [7].基于SVM的河道洪峰水位校正预报方法[J]. 水力发电 2020(04)
- [8].基于SVM的煤与瓦斯突出预测模型及应用[J]. 陕西煤炭 2020(02)
- [9].基于实时电价和加权灰色关联投影的SVM电力负荷预测[J]. 电网技术 2020(04)
- [10].基于超声波扫描和SVM的综合管廊故障诊断模型[J]. 科技与创新 2020(07)
- [11].基于SVM理论的航空发动机飞行数据可视化建模[J]. 科技创新与应用 2020(12)
- [12].基于SVM的固化土无侧限抗压强度模型[J]. 宁波大学学报(理工版) 2020(04)
- [13].基于遗传算法和SVM的肝豆状核变性震颤评估方法研究[J]. 西安文理学院学报(自然科学版) 2020(03)
- [14].基于SVM的高速公路预防性养护效果评价模型及应用[J]. 工程建设 2020(05)
- [15].基于因子分析和SVM的网络舆情危机预警研究[J]. 重庆工商大学学报(自然科学版) 2020(05)
- [16].基于SVM的物联网大数据有效信息过滤挖掘[J]. 河南科技 2020(26)
- [17].基于改进SVM算法的思政教育动态预警系统研究[J]. 微型电脑应用 2020(09)
- [18].基于SVM技术调剖(驱)潜力预测[J]. 承德石油高等专科学校学报 2019(05)
- [19].基于海量数据的不平衡SVM增量学习的钓鱼网站检测方法[J]. 电信工程技术与标准化 2016(12)
- [20].结合主方向和SVM的人脸表情识别[J]. 廊坊师范学院学报(自然科学版) 2016(04)
- [21].SVM算法支持下的耕地面积退化遥感监测——以昆明市呈贡区为例[J]. 安徽农业科学 2017(01)
- [22].矿井突水水源的SVM识别方法[J]. 辽宁工程技术大学学报(自然科学版) 2017(01)
- [23].基于SVM算法的移动智能终端安全等级分级模型[J]. 通信技术 2017(04)
- [24].图像视觉显著性和改进型SVM在图像分割中的研究[J]. 通讯世界 2017(08)
- [25].一种基于决策树的SVM算法[J]. 太原学院学报(自然科学版) 2017(01)
- [26].基于多级SVM分类的语音情感识别算法[J]. 计算机应用研究 2017(06)
- [27].基于模糊信息粒与SVM的道路交通状态波动分析[J]. 重庆交通大学学报(自然科学版) 2017(07)
- [28].基于SVM的上证指数预测研究[J]. 软件导刊 2017(08)
- [29].基于集成SVM的肺部肿瘤PET/CT三模态计算机辅助诊断方法[J]. 生物医学工程研究 2017(03)
- [30].一种基于SVM的声源定位算法[J]. 计算机技术与发展 2017(09)