光学乐谱识别技术研究与实现

光学乐谱识别技术研究与实现

论文摘要

纸质乐谱向数字化乐谱的转换,是人类音乐活动与计算机音乐处理之间进行信息交流的必经之路。光学乐谱识别是将纸质乐谱扫描输入计算机后,对乐谱图像加以处理、识别、分析,最终获得乐谱的计算机数字表达的过程。光学乐谱识别技术突破了纯手工的乐谱数字化瓶颈,为乐谱数字化提供了一条智能、高效、快捷的新途径,具有重要的理论研究意义和应用价值。本文以印刷体多声部五线谱为研究对象,从谱线定位与删除、音符识别、乐谱专用符号识别、乐谱重建与语义解释四个方面,对乐谱识别的关键技术进行了系统深入地研究,在多个环节上提出了行之有效的新思路和新方法。谱线定位与删除是乐谱识别的首要环节。在谱线定位方面,本文提出了基于交叉相关性的乐谱图像变形校正与谱线定位算法,其本质是利用“化整为零、相关计算”的思想,对基于水平投影的谱线定位方法的一种改进。该算法在保持了投影方法计算简单、抗噪声能力强的原有优势的同时,弥补了其对变形敏感的不足,有效解决了现有统计和结构两类谱线定位方法存在的抗变形和抗噪声之间的矛盾。在谱线删除方面,本文针对谱线删除过程中存在的“过删除”问题,提出了基于图段拓扑关系的谱线删除算法。与现有谱线删除方法相比,该算法在提高删除单元表达层次的同时,强调对删除单元周边环境特征的分析和判断,能够更全面、清晰地观察到谱线与非谱线像素的区别,从而明显减少谱线“过删除”现象的发生,保证了乐谱图形符号在谱线删除之后的完整性。音符识别是乐谱识别的核心与关键。本文根据音符的多样性和多态性特点,确定了基于结构的音符识别方案,将其识别过程划分为基元抽取和结构分析两个阶段。在音符基元抽取方面,提出了基于垂直游程编码的粗提取、基于水平游程编码的精检测的符干抽取方法,克服了现有方法对复杂音符适应性差、抽取结果不完整等缺陷;设计了一种先分割、后特征检测的实心符头抽取方法,该方法利用音符先验知识和已有的谱线、符干识别结果对符头进行切割,解决了粘连符头的切分难题;提出一种基于块状体分割和特征检测的尾桥抽取方法,避开了传统的直线抽取方法所无法处理的尾桥粘连问题。在音符结构分析方面,提出了一种基于作用场的音符结构分析方法。该方法将物理学中的作用场概念引入到音符基元的关系表达,实现了知识性、鲁棒性和精确性三者的统一。在此基础上,定义了六个音符子结构,建立了关键结构优先定位的音符结构分析模型,实现了音符基元数据向音符对象的重建。该模型体现了人工识谱时突出重点特征、从整体到细节的思维习惯,不仅减少了分析的复杂度,而且具有较强的基元冗余排错能力。对于音符除外的其它乐谱符号即乐谱专用符号。提出了一种基于几何、中心矩和穿刺三类特征的神经网络识别方法。上述三类特征能够很好地兼顾统计特征的抗噪性和结构特征对细微差别的分类能力,体现了各类乐谱专用符号的实际特点,并采用具有强大非线性分类能力的BP神经网络作为符号分类器,取得了良好的识别效果。最后,本文通过建立“乐谱结构树”,实现了由散乱图形符号数据到乐谱数据的有机组织和重建。讨论了音乐事件序列的生成方法,实现了乐谱语义解释及其语义内容的标准MIDI格式文件输出。作为本文的主要研究成果之一,开发研制了一个完整的乐谱智能识别原型系统IOMRS。应用本文提出的图形与语义相结合的识别评价体系,对IOMRS系统和商品化乐谱识别系统进行了性能评测和比较。测试结果表明,IOMRS的整体识别性能已达到目前优秀商品化乐谱识别系统的水平,并且在音符识别、不同数据环境下的适应性和执行速度三方面表现出明显的优势。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 光学乐谱识别的产生背景、基本概念和研究内容
  • 1.1.1 产生背景
  • 1.1.2 概念
  • 1.1.3 乐谱文档特点分析
  • 1.1.4 研究内容
  • 1.2 研究意义
  • 1.2.1 理论意义
  • 1.2.2 应用价值
  • 1.3 国内外研究综述
  • 1.3.1 发展历程与技术论坛
  • 1.3.2 主要研究机构与成果
  • 1.4 本文的工作
  • 1.5 论文组织结构
  • 第二章 谱线定位与删除
  • 2.1 引言
  • 2.2 现有谱线定位方法及其本文方法
  • 2.2.1 统计变换方法
  • 2.2.2 结构搜索方法
  • 2.2.3 本文方法
  • 2.3 基于交叉相关性的变形校正与谱线定位方法
  • 2.3.1 方法思路
  • 2.3.2 乐谱图像变形校正算法
  • 2.3.3 谱线定位流程
  • 2.3.4 实验结果
  • 2.4 现有谱线删除方法及其本文方法
  • 2.4.1 像素分析方法
  • 2.4.2 游程分析方法
  • 2.4.3 图段分析方法
  • 2.4.4 本文方法
  • 2.5 基于图段拓扑关系的谱线删除方法
  • 2.5.1 方法思路
  • 2.5.2 建立游程邻接图
  • 2.5.3 建立图段邻接图
  • 2.5.4 谱线删除
  • 2.5.5 实验结果
  • 2.6 本章小结
  • 第三章 音符识别(一)—基元抽取
  • 3.1 引言
  • 3.2 现有音符基元抽取方法及其本文方法
  • 3.2.1 投影法
  • 3.2.2 骨架化方法
  • 3.2.3 游程分析方法
  • 3.2.4 模板匹配方法
  • 3.2.5 数学形态学方法
  • 3.2.6 本文方法
  • 3.3 符干抽取
  • 3.3.1 方法思路
  • 3.3.2 抽取算法描述
  • 3.3.3 实验结果
  • 3.4 实心符头抽取
  • 3.4.1 方法思路
  • 3.4.2 抽取算法描述
  • 3.4.3 实验结果
  • 3.5 尾桥抽取
  • 3.5.1 方法思路
  • 3.5.2 抽取算法描述
  • 3.5.3 实验结果
  • 3.6 空心符头与符尾识别
  • 3.7 本章小结
  • 第四章 音符识别(二)—结构分析
  • 4.1 引言
  • 4.2 现有音符结构分析方法及其本文方法
  • 4.2.1 过程描述方法
  • 4.2.2 说明型描述方法
  • 4.2.3 方法局限性讨论
  • 4.2.4 本文方法
  • 4.3 音符基元作用场
  • 4.3.1 作用场定义
  • 4.3.2 势函数定义
  • 4.3.3 作用场的优越性
  • 4.4 音符结构分析模型
  • 4.4.1 音符子结构定义
  • 4.4.2 音符子结构的特征分析
  • 4.4.3 音符结构分析模型及其优越性
  • 4.5 基于作用场的音符结构分析
  • 4.5.1 作用场、音符基元的数据结构描述
  • 4.5.2 主音符结构识别
  • 4.5.3 主尾桥结构与尾桥中音符结构识别
  • 4.5.4 和声与反向和声结构识别
  • 4.5.5 副尾桥结构识别
  • 4.6 音符重建
  • 4.6.1 音符的数据结构描述
  • 4.6.2 音符重建流程
  • 4.6.3 音符删除
  • 4.7 实验结果
  • 4.8 本章小结
  • 第五章 乐谱记号识别
  • 5.1 引言
  • 5.2 文字提取
  • 5.2.1 乐谱文字的特征分析
  • 5.2.2 提取算法描述
  • 5.3 点、线图形提取
  • 5.3.1 乐谱中的线条图形特征分析
  • 5.3.2 提取算法描述
  • 5.4 乐谱专用符号识别
  • 5.4.1 特征提取
  • 5.4.2 基于BP神经网络的分类器设计
  • 5.4.3 网络训练与测试结果
  • 5.4.4 符号识别流程
  • 5.4.5 实验结果
  • 5.5 本章小结
  • 第六章 乐谱重建与语义解释
  • 6.1 引言
  • 6.2 乐谱重建
  • 6.2.1 谱表重建
  • 6.2.2 乐谱小节重建
  • 6.2.3 谱号、调号、拍号重建
  • 6.2.4 音符重建
  • 6.3 音乐语义解释
  • 6.3.1 音高与时值的确定
  • 6.3.2 音乐事件序列
  • 6.3.3 MIDI输出
  • 6.4 本章小结
  • 第七章 乐谱识别系统IOMRS与性能评价
  • 7.1 引言
  • 7.2 IOMRS系统开发实现
  • 7.2.1 系统简介
  • 7.2.2 功能结构
  • 7.2.3 体系结构
  • 7.3 IOMRS系统识别实例
  • 7.4 IOMR系统性能评价
  • 7.4.1 评价方法
  • 7.4.2 IOMRS系统与商品化乐谱识别软件的识别性能对比
  • 7.5 本章小结
  • 第八章 结束语
  • 8.1 论文内容总结
  • 8.2 进一步研究工作
  • 参考文献
  • 附录 在攻读博士学位期间获得的主要成绩
  • 1. 发表论文
  • 2. 参与课题
  • 3. 成果奖励
  • 致谢
  • 相关论文文献

    • [1].奋进的音符 多彩的乐章[J]. 音乐创作 2019(10)
    • [2].春天的音符[J]. 东北水利水电 2020(04)
    • [3].流淌的音符[J]. 科教导刊(下旬) 2020(02)
    • [4].流淌的音符[J]. 科教导刊(中旬刊) 2020(03)
    • [5].流淌的音符[J]. 科教导刊(上旬刊) 2020(03)
    • [6].流淌的音符[J]. 科教导刊(下旬) 2020(03)
    • [7].跳动的音符[J]. 工会博览 2020(14)
    • [8].流动的音符[J]. 青海国土经略 2020(02)
    • [9].音符[J]. 资源导刊 2018(12)
    • [10].带你认一认马路上的“音符”[J]. 道路交通管理 2019(01)
    • [11].流淌的音符[J]. 科教导刊(下旬) 2019(02)
    • [12].“音符”[J]. 中国工会财会 2019(09)
    • [13].《跳动的音符》[J]. 工会博览 2018(11)
    • [14].浅谈音乐中各种音符的应用[J]. 黄河之声 2018(12)
    • [15].“爱”的音符——“问题儿童”的转变[J]. 科学大众(科学教育) 2018(10)
    • [16].绿色音符[J]. 当代贵州 2018(33)
    • [17].家乡音符[J]. 青海金融 2016(11)
    • [18].劳动音符[J]. 施工企业管理 2017(05)
    • [19].缀在枝头的音符[J]. 兵团工运 2017(04)
    • [20].飘荡在维也纳上空的音符[J]. 检察风云 2017(08)
    • [21].沙漠上的音符[J]. 中国测绘 2017(01)
    • [22].98个音符[J]. 齐鲁艺苑 2017(05)
    • [23].音符[J]. 中国畜牧业 2015(23)
    • [24].《城市音符》组照[J]. 建筑 2016(03)
    • [25].城市音符[J]. 审计与理财 2016(05)
    • [26].从音符到音乐——浅析音乐中的情感表达[J]. 大众文艺 2015(06)
    • [27].酒瓶·音符之三[J]. 文艺研究 2015(07)
    • [28].天蚀的音符[J]. 美术教育研究 2015(18)
    • [29].跳动的音符(优秀奖)[J]. 照相机 2015(11)
    • [30].秋天的音符[J]. 金秋 2019(24)

    标签:;  ;  ;  ;  ;  ;  ;  

    光学乐谱识别技术研究与实现
    下载Doc文档

    猜你喜欢