银行票据手写数字串识别的预处理与分割

银行票据手写数字串识别的预处理与分割

论文摘要

票据手写数字串识别系统对银行业有非常大的实用价值。对于扫描得到的票据图像,主要处理步骤包括字符识别以及识别前的预处理与分割两大部分,现有识别算法中,单个数字字符的识别正确率高于99%,在这种情况下,提高整个数字串识别率的关键在于数字串图像的前期预处理与分割。本文以某建设银行支票中的手写数字串为背景,主要对预处理和分割过程中的一些核心技术进行研究和改进,并取得了一定的成果。主要研究内容包括:1)对彩色图像进行灰度化处理,针对图像中存在红色印章的情况,提出了适合本文的图像灰度化算法,在保留数字字符信息的情况下去除印章影响,同时对灰度图像进行增强、去噪,为后续工作打好基础。2)去除数字串的外框,主要分为框线检测与字符相交检测两部分。针对框线有些倾斜、弯曲的情况,提出了先进行直线检测,再寻找精确边缘点,最后分段进行直线拟合的方法准确描述框线。在框线与字符相交的处理过程中,提出了基于灰度梯度的交叉点检测算法,并结合字符与框线的相交形状对交叉点进行左右、上下配对,准确描述了相交部分的信息,最后在去框的过程中,对字符与框线相交的部分进行了保留。3)对数字串进行倾斜矫正,由于每个人的书写习惯不同,不少数字串是倾斜的,为了便于切分以及使数字的特征更加集中,需要进行方向上的归一化处理。对于倾斜角的计算,本文首先提出了基于数字笔画梯度方向的方法,该方法对于90%的数字串有效,对于另外的10%情况,本文又提出了基于字符框架信息的方法计算倾斜角。两种方法相辅相成,取得了很好的效果。4)切割整个数字串为单个数字字符,首先根据每个连通域的字符轮廓信息判别此连通域为单字或粘连字串,对于粘连数字串,提出了一种基于灰度图像的切分算法。算法首先根据灰度图像中,字符边缘点的梯度方向变化率准确寻找切分点,再结合切分线的类别连接切分点,计算切分可靠性,然后选择不同的切分线,生成切割组合,最后基于识别反馈的方法选择最佳切割组合。结合改进的k-近邻分类器,实现了票据手写数字串识别系统,测试1000张数字串图像(每串12个数字),识别正确率为90.2%。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 1 绪论
  • 1.1 金融票据OCR系统
  • 1.2 OCR技术与性能
  • 1.3 预处理与分割难点与现状
  • 1.4 本文研究工作概述
  • 1.5 本文的内容安排
  • 2 灰度化与二值化
  • 2.1 图像灰度化以及去章
  • 2.2 Otsu二值化
  • 2.3 本章小结
  • 3 框线的检测与去除
  • 3.1 框线的检测
  • 3.1.1 框线说明
  • 3.1.2 直线检测
  • 3.1.3 分段直线拟合
  • 3.2 框线的去除
  • 3.2.1 交叉点检测
  • 3.2.2 交叉点筛选配对
  • 3.2.3 去框与结果分析
  • 3.3 本章小结
  • 4 数字串的倾斜矫正
  • 4.1 引言
  • 4.2 计算字串倾斜角
  • 4.2.1 基于梯度方向计算倾斜角
  • 4.2.2 基于字符框架计算倾斜角
  • 4.3 根据倾斜角矫正图像
  • 4.4 本章小结
  • 5 数字串的切分
  • 5.1 引言
  • 5.2 判断数字串是否粘连
  • 5.3 切分粘连数字串
  • 5.3.1 粘连数字串说明
  • 5.3.2 基于灰度图像寻找切分点
  • 5.3.3 生成切分线
  • 5.3.4 产生切割组合
  • 5.3.5 基于识别选择最佳切分组合
  • 5.4 切分结果与分析
  • 5.4.1 k-近邻分类器
  • 5.4.2 切分结果与分析
  • 5.5 本文实验结果与分析
  • 5.6 本章小结
  • 6 总结与期望
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].基于主成分分析法及贝叶斯分类器的手写数字识别[J]. 大众科技 2015(09)
    • [2].基于支持向量机的手写数字串识别[J]. 湖北第二师范学院学报 2010(02)
    • [3].基于决策树的手写数字的识别[J]. 信息技术与信息化 2011(06)
    • [4].手写数字体自动识别技术的研究现状[J]. 浙江万里学院学报 2015(02)
    • [5].从知其然到知其所以然——基于虚谷号实现手写数字的识别[J]. 中国信息技术教育 2019(11)
    • [6].一种基于核方法的手写数字图像去噪算法[J]. 计算机工程与科学 2008(12)
    • [7].手写数字签名进化论[J]. IT经理世界 2013(18)
    • [8].基于卷积神经网络模型的手写数字辨识算法研究[J]. 计算机应用与软件 2019(08)
    • [9].基于笔划组合的手写数字切分[J]. 中国图象图形学报 2009(08)
    • [10].基于卷积神经网络的手写数字图像识别方法[J]. 绵阳师范学院学报 2020(02)
    • [11].基于KNN的手写数字的识别[J]. 农业装备与车辆工程 2017(10)
    • [12].基于神经网络的手写数字串识别方法研究[J]. 科技经济导刊 2020(17)
    • [13].基于卷积神经网络的藏文手写数字和字母识别研究[J]. 青海师范大学学报(自然科学版) 2019(04)
    • [14].基于决策树的手写数字识别的应用研究[J]. 软件 2018(03)
    • [15].NEW ARRIVAL[J]. 优品 2012(06)
    • [16].基于混合二值化的表格手写数字串的完整提取[J]. 模式识别与人工智能 2008(03)
    • [17].基于SVM技术实现手写数字分类识别的研究[J]. 电脑知识与技术 2020(06)
    • [18].手写数字深度特征学习与识别[J]. 计算机技术与发展 2016(07)
    • [19].一种基于KNN算法的手写数字分类器的设计与实现[J]. 信息通信 2020(10)
    • [20].多分类器在长串手写数字识别中的实验[J]. 电子技术与软件工程 2017(13)
    • [21].基于矩阵SVD的手写数字分类及其特征区域的SVD优化[J]. 软件 2016(07)
    • [22].神经网络在识别手写数字方向的应用[J]. 通讯世界 2015(22)
    • [23].手写数字签名助推金融无纸化[J]. 金融电子化 2014(04)
    • [24].基于统计和结构特征的手写数字识别研究[J]. 计算机工程与设计 2012(04)
    • [25].基于七段中轴投影的手写数字可信计算识别法[J]. 杭州电子科技大学学报 2009(05)
    • [26].基于K-近邻算法的手写数字识别[J]. 数码世界 2018(09)
    • [27].试卷存档管理中手写数字图像的预处理[J]. 信息与电脑(理论版) 2011(18)
    • [28].HMM在手写数字结构信息建模中的应用[J]. 计算机工程与应用 2012(31)
    • [29].基于深层自适应平衡自编码机的手写数字分类[J]. 传感器与微系统 2019(01)
    • [30].手写数字识别研究[J]. 无线互联科技 2017(11)

    标签:;  ;  ;  ;  ;  ;  

    银行票据手写数字串识别的预处理与分割
    下载Doc文档

    猜你喜欢