手写汉字图像动态信息恢复方法研究

手写汉字图像动态信息恢复方法研究

论文摘要

手写汉字图像动态信息恢复是指从脱机静态字符图像中恢复书写者在书写过程产生的时序信息,将一个二维的静态图像转换为多个一维的动态时间序列的过程。对手写汉字图像进行动态信息恢复不仅可以实现对大量非结构化的静态文本图像的有效管理,使其方便地在计算机上进行存储和检索,而且可以在脱机和联机的应用处理方法之间构建桥梁,应用目前现有的联机处理方法来处理脱机图像,提高脱机处理的性能,满足越来越广泛和深入的手写汉字信息化管理与应用的需求。围绕手写汉字动态信息恢复中的基于结构分析和基于模型匹配两类问题,开展了5个方面的研究工作:基于模糊区域检测的手写汉字笔划提取、汉字的结构化建模表示、基于结构模型的动态信息恢复,手写汉字图像的骨架修正以及基于模型匹配的动态信息恢复技术。针对手写汉字笔划提取的重点和难点——模糊区域的识别和解析,提出了一种新的基于模糊区域检测的手写汉字笔划提取算法,提高基于结构分析的动态信息恢复的预处理效果。首先,由骨架特征点来确定模糊区域的近似中心点;接着,利用近似中心点和其周围的轮廓信息进行模糊区域检测;然后,利用图模型来对子笔划和模糊区域进行建模,构造贝叶斯分类器来分析子笔划对的连续性,并且相应地给出了约束条件和判断准则,分别用于笔划路径的搜索和处理多描绘子笔划;最后,进行B样条插值来提取细化后的笔划。该算法不仅能够有效地用于模糊区域检测和笔划提取,而且能够避免笔划在模糊区域内的形状畸变。在笔划提取的基础上,分析汉字的层次结构,提出了一种脱机手写汉字动态信息恢复模型。将汉字依次分为4个层次:整字、部件、子部件和笔划,利用4种拆分操作将整字拆分为部件,部件拆分为子部件,并由此形成了子部件间的5种拆分关系。通过定义一组拆分关系与子部件偏序关系之间的对应规则,得到子部件的全序关系。而子部件作为最基本的恢复单位,其书写顺序通过对笔划和交叉笔划对进行分类来得到。该方法对于具有完整层次结构的手写汉字的书写顺序恢复,具有较好的准确率和处理速度。针对现存的大多数的骨架提取算法会产生伪段或形状扭曲这个不可避免的问题,提出了一种通过识别和修正不可靠段来改进手写图像骨架的方法。首先,给出了一种新颖的特征——迭代次数,将骨架的不可靠段看做是迭代次数异常的点的集合,并且采用无向图对字符骨架进行建模,将图中的节点对应为骨架上的特征点及其周围具有异常迭代次数的像素点;其次,为了避免骨架分枝长度对不可靠段识别的影响,又给出了一种基于迭代次数的节点距离度量方法,用于对图中的边进行加权。于是,不可靠段识别的问题就转换成将该无向图分解为一个子图集合的问题,并可通过一种有效的聚类质量估算函数对该图进行聚类来解决。最后,在骨架修正阶段,利用最佳匹配的方法来得到可靠段之间的连续性,而对不可靠段的修正则是通过对其相连可靠段的采样点进行B样条插值来进行。该方法不仅可以修正汉字的骨架,而且对于英文的骨架也具有较高的修正效果。在基于模型匹配的动态信息恢复的研究中,采用序列匹配的方法找出输入字符的骨架和动态模型序列之间的对应关系,以达到动态信息恢复的目的。首先,采用形状上下文来定义输入图像和模型图像对应点之间的匹配代价:然后,通过建模对字符骨架进行分段,并采用基于DTW距离的子序列匹配来找出骨架各分段的最佳序列匹配;为了避免搜索整条序列,针对骨架分段的特点,设计一种具有较低计算代价的子序列匹配算法;最后,通过子图映射和子图恢复来找出最佳的全局匹配路径,并分析了输入图像的子图集合到模型序列的映射方法,以及子图内部的书写顺序恢复的路径约束。该方法对于形状和位置的变化以及笔划的缺省和连笔具有一定的鲁棒性和较高的恢复性能。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景、目的及意义
  • 1.2 国内外研究概况
  • 1.3 本论文的工作
  • 2 手写汉字的动态信息恢复技术分析
  • 2.1 引言
  • 2.2 手写汉字信息化管理技术分析
  • 2.3 动态信息恢复的关键技术分析
  • 2.4 本章小结
  • 3 手写汉字图像的骨架修正算法
  • 3.1 引言
  • 3.2 基于迭代次数的不可靠段识别
  • 3.3 骨架修正
  • 3.4 实验与分析
  • 3.5 本章小结
  • 4 基于模糊区域检测的笔划提取算法
  • 4.1 引言
  • 4.2 模糊区域的检测
  • 4.3 笔划提取
  • 4.4 实验与分析
  • 4.5 本章小结
  • 5 基于结构分析的动态信息恢复模型
  • 5.1 引言
  • 5.2 汉字的层次模型
  • 5.3 拆分操作
  • 5.4 汉字的拆分
  • 5.5 书写顺序恢复
  • 5.6 实验与分析
  • 5.7 本章小结
  • 6 基于模型匹配的动态信息恢复
  • 6.1 引言
  • 6.2 建模表示
  • 6.3 点匹配
  • 6.4 子序列匹配
  • 6.5 模型映射
  • 6.6 实验与分析
  • 6.7 本章小结
  • 7 全文总结和研究展望
  • 7.1 全文总结
  • 7.2 研究展望
  • 致谢
  • 参考文献
  • 附录1 攻读博士学位期间发表论文
  • 附录2 本文中相关概念和定义
  • 相关论文文献

    • [1].特征分组提取融合深度网络手写汉字识别[J]. 计算机工程与应用 2020(12)
    • [2].计算机汉字识别和静态手写汉字签名鉴定技术综述[J]. 网络安全技术与应用 2019(10)
    • [3].手写汉字识别的发展应用综述[J]. 电视指南 2017(24)
    • [4].手写汉字已成为需要保护的传统文化[J]. 基础教育课程 2016(02)
    • [5].最需要继承保护的是手写汉字[J]. 中国钢笔书法 2015(10)
    • [6].基于压缩感知的手写汉字识别研究[J]. 西安航空学院学报 2017(05)
    • [7].手写汉字的特性与生命力[J]. 中国教师 2008(04)
    • [8].基于反向传播算法在联机手写汉字结构识别中的应用[J]. 软件导刊 2011(04)
    • [9].基于笔顺自由及连笔的联机手写汉字识别[J]. 计算机系统应用 2009(05)
    • [10].深度学习在手写汉字识别中的应用综述[J]. 自动化学报 2016(08)
    • [11].手写汉字规定格式练习系统设计[J]. 教师 2009(16)
    • [12].一种改进的脱机手写汉字四角特征粗分类方法[J]. 信息安全与技术 2013(04)
    • [13].基于联机手写汉字字块特征码提取的研究[J]. 电脑知识与技术 2011(01)
    • [14].基于结构聚类和笔画分析的粘连手写汉字切分[J]. 计算机工程与应用 2008(34)
    • [15].基于卷积神经网络的手写汉字识别研究[J]. 信息技术与信息化 2018(12)
    • [16].基于深度学习的异噪声下手写汉字识别的研究[J]. 计算机应用研究 2019(12)
    • [17].基于压缩感知的阅卷系统手写汉字识别算法[J]. 电子科技 2018(03)
    • [18].用于手写汉字识别的文本分割方法[J]. 智能计算机与应用 2018(02)
    • [19].空中手写汉字交互输入与识别实验平台构建[J]. 实验技术与管理 2016(07)
    • [20].用于相似字识别的手写汉字特征优化方法[J]. 哈尔滨工程大学学报 2012(07)
    • [21].基于信息熵的静态手写汉字签名鉴定研究[J]. 计算机应用与软件 2013(01)
    • [22].基于自产生投票的手写汉字识别[J]. 自动化学报 2013(04)
    • [23].一种静态手写汉字签名特征描述算法的实现[J]. 软件导刊 2012(09)
    • [24].“书法速成”:一个浮躁时代的商业噱头[J]. 美术观察 2010(07)
    • [25].概率神经网络在手写汉字识别中的应用[J]. 电子设计工程 2016(02)
    • [26].基于局部模块组合的手写汉字识别算法[J]. 微计算机信息 2011(02)
    • [27].基于相似度的手写汉字笔划鉴别方法实验研究[J]. 实验室研究与探索 2015(12)
    • [28].一种新的手写汉字生成方法[J]. 太原大学学报 2014(03)
    • [29].一种多模型超图用于手写汉字识别算法[J]. 计算机应用与软件 2019(07)
    • [30].联机手写汉字识别系统应用研究[J]. 信息与电脑(理论版) 2018(18)

    标签:;  ;  ;  ;  ;  ;  ;  

    手写汉字图像动态信息恢复方法研究
    下载Doc文档

    猜你喜欢