非限定手写体汉字分割与多类别票据处理研究

非限定手写体汉字分割与多类别票据处理研究

论文摘要

手写汉字分割和多类别金融票据图像分类是实现票据自动处理的基础。非限定手写汉字分割问题是手写汉字识别的关键问题,也是目前的分割-识别框架中的难点。 本文提出了基于模板匹配和差影处理的票据图像分类方法。在原始票据图象上利用模板匹配先得到相应的有效图象,再运用差影技术对滤波去噪后的有效图象进行模板存在与否的检测。实际的票据分类处理实验结果证实了所提出的方法的有效性。 本文提出了一种改进的投影方法对非限定手写汉字图像进行先分割。根据非限定手写汉字的一些具体特征,对经典投影方法做了补充和扩展,在对字符图像进行二值化和投影去噪后,用最小二乘法获得字符的预验宽度,根据一定的准则判定了投影分割点。在现有方法的基础上建立了算法的基本模型,编写了相应的程序并应用于支票校验系统中。 在分割粘连和重叠的汉字串中,本文提出了一种结构分析结合后期识别的方法。对整个汉字图像进行连通域分析,得到初选的分割点。通过轮廓差分析以及投影分析,去除假分割点。采用本文的分割以及识别合并的方法,对12000个粘连和重叠的汉字串进行分割实验,准确率达92.4%。 最后,本文给出了一个后督支票自动处理系统,包括支票要素分割,大写金额字符串的分割,小写金额字串的分割和去噪,无限制手写体大写金额字符的识别,无限制手写体阿拉伯数字的识别等。该系统已经在实践当中得到了使用,取得了良好的效果。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 OCR问题的由来
  • 1.2 手写汉字 OCR的特点
  • 1.3 非限定手写汉字分割
  • 1.3.1 手写汉字分割的常用方法
  • 1.3.2 本文所采用的方法
  • 1.4 本文研究工作概述
  • 1.5 本文内容的安排
  • 2 多类别票据图像分类
  • 2.1 问题的由来
  • 2.2 有效图像获取
  • 2.3 模板的存在性检测
  • 2.4 实验结果
  • 2.5 本章小结
  • 3 基于改进投影法的非限定手写体汉字分割
  • 3.1 投影法概述
  • 3.2 磁码信息识别
  • 3.3 分割前的预处理
  • 3.3.1 复杂背景的图像二值化
  • 3.3.2 二值图像去噪处理
  • 3.4 预验字宽信息的获取
  • 3.5 分割点的选取
  • 3.6 结果与讨论
  • 3.7 本章小结
  • 4 基于结构信息的非限定手写体汉字分割
  • 4.1 问题的由来
  • 4.2 预分割点确定
  • 4.2.1 连通域分析
  • 4.2.2 连通域轮廓提取
  • 4.3 轮廓分析确定预分割点
  • 4.4 假分割点去除
  • 4.4.1 利用投影信息去除假分割点
  • 4.4.2 分析轮廓差去除假分割点
  • 4.4.3 分割点数目的确定
  • 4.5 粘连的连通域的分割
  • 4.6 基于结构信息的汉字的重组
  • 4.6.1 由上而下合并
  • 4.6.2 由左而右的合并
  • 4.7 基于识别的汉字的重组
  • 4.7.1 基于结构的汉字识别器的设计
  • 4.7.2 识别再合并过程
  • 4.8 实验结果
  • 4.9 本章方法的讨论
  • 4.10 本章小结
  • 5 一个基本的后督支票自动处理系统
  • 5.1 银行后督支票自动处理的应用和功能
  • 5.2 后督支票自动处理系统的系统结构、组织和处理流程
  • 5.2.1 应用系统的结构组织
  • 5.2.2 后督自动处理流程
  • 5.3 支票的前期处理
  • 5.4 大写金额图像的二值化
  • 5.4.1 问题分析
  • 5.4.2 去除底纹
  • 5.4.3 提取大写金额的有效区间
  • 5.4.4 印章污染的去除
  • 5.5 小写金额图像的二值化
  • 5.6 手写体大写金额的处理
  • 5.6.1 手写体汉字的规范化
  • 5.6.2 基于模糊笔画方向的统计特征
  • 5.6.3 识别方法及实验结果
  • 5.6.4 大写金额的整体处理及实验结果
  • 5.7 手写体小写金额的处理
  • 5.7.1 手写体小写金额的分割
  • 5.7.2 手写体阿拉伯数字识别方案
  • 5.7.3 基于轮廓分段特征的手写体数字识别方法
  • 5.7.4 基于笔画归正模板的识别方法
  • 5.7.5 手写体数字单字识别的实验结果
  • 5.7.6 小写金额的整体处理及实验结果
  • 5.8 本章小结
  • 结束语
  • 致谢
  • 参考文献
  • 附录
  • 相关论文文献

    • [1].手写体文字识别的特点及神经机制[J]. 心理科学进展 2018(07)
    • [2].基于过程神经元的手写体汉字仿人识别研究[J]. 计算机仿真 2008(07)
    • [3].一种用于手写体汉字切分的优化模型[J]. 计算机工程与应用 2008(02)
    • [4].基于结构知识的手写体汉字合成方法[J]. 计算机工程 2011(03)
    • [5].基于仿反馈机制的脱机手写体汉字认知模型[J]. 控制工程 2019(03)
    • [6].具有变精度反馈机制的脱机手写体汉字智能认知[J]. 计算机应用与软件 2018(07)
    • [7].基于数学形态学的手写体汉字细化方法研究[J]. 微型机与应用 2011(20)
    • [8].手写体汉字八形态编码识别方法的研究[J]. 淮北师范大学学报(自然科学版) 2012(02)
    • [9].一种手写体汉字的非线性规范化方法[J]. 新疆师范大学学报(自然科学版) 2008(03)
    • [10].多民族脱机手写体汉字数据库的设计与构建[J]. 大连民族学院学报 2011(05)
    • [11].基于FSVM脱机手写体汉字分类识别研究[J]. 计算机工程与应用 2014(23)
    • [12].基于过程神经网络的汉字特征提取方法的研究[J]. 合肥工业大学学报(自然科学版) 2013(10)
    • [13].几种手写体汉字特征提取方法的比较研究[J]. 内江科技 2009(10)
    • [14].免细化过程的脱机手写体汉字的动态信息提取[J]. 科技信息(科学教研) 2008(01)
    • [15].基于HHT的脱机手写体汉字特征提取[J]. 计算机应用 2009(S2)
    • [16].基于多群体遗传算法的汉字识别系统设计[J]. 合肥工业大学学报(自然科学版) 2010(01)
    • [17].基于二维主成分分析与卷积神经网络的手写体汉字识别[J]. 计算机应用 2020(08)
    • [18].改进的脱机手写体汉字细化算法[J]. 计算机系统应用 2011(06)
    • [19].规范汉字规范写[J]. 亚太教育 2016(30)
    • [20].具有仿反馈调整机制的汉字认知方法研究[J]. 控制工程 2019(06)
    • [21].基于变精度粗糙集的脱机手写体汉字识别[J]. 合肥工业大学学报(自然科学版) 2010(10)
    • [22].图像处理中关于汉字粘连字符的分割的背景算法[J]. 科技广场 2008(01)
    • [23].基于可变窗口的古代手写汉字多步切分方法[J]. 计算机工程与设计 2016(04)
    • [24].基于邻域特征的笔划交叉点提取算法的研究[J]. 计算机工程与设计 2008(19)
    • [25].基于过程神经元网络的汉字笔段提取算法研究[J]. 计算机应用研究 2010(05)
    • [26].基于深度学习的汉字书法识别研究[J]. 电子测试 2019(24)
    • [27].基于改进ZS细化算法的手写体汉字骨架提取[J]. 计算机应用与软件 2020(07)
    • [28].面向汉字识别的新特征及其提取方法[J]. 软件 2015(03)
    • [29].KNN-均值算法[J]. 现代计算机(专业版) 2014(17)
    • [30].一种不确定性二叉树SVM的脱机手写体汉字识别研究[J]. 安庆师范学院学报(自然科学版) 2013(01)

    标签:;  ;  ;  ;  ;  ;  

    非限定手写体汉字分割与多类别票据处理研究
    下载Doc文档

    猜你喜欢