论文摘要
二值化技术(算法)作为图像分割技术中的一种,本质上是通过阈值(Threshold)的选择将数字图像中的像素点进行分类的技术。作为一种重要的图像分割技术,它在图像模式识别系统中对系统的最终识别率有着极其重要的影响。图像模式识别系统由图像预处理和模式识别两个子系统构成,图像预处理系统主要完成待识别目标的分割、特征提取等任务,而二值化技术则是将待识别物体从复杂背景中分割出来的主要手段;如果待识别物体无法从背景中分割出来或者分割的效果较差,那么无论识别算法本身的好坏,图像模式识别系统都将无法较好的完成识别任务。支票识别系统,作为图像模式识别系统中的一种,它利用DIA(Document Image Analysis)技术和OCR(Optical Character Recognition)技术完成对支票图像中目标物的分析和识别任务,而二值化技术在整个系统的预处理中扮演着极其重要的角色,是文本图像分析(DIA)和光学字符识别(OCR)的基础。在支票识别系统中,支票经过扫描后,形成一张支票数字图像,对此图像进行预处理的关键是获得一张支票图像的二值图像,从而将目标物体与背景分割开来。该二值图像作为后继处理的基础,对后继处理(金额栏提取、字符识别等)有着至关重要的影响。在支票识别系统中,由于票面背景复杂(印章、底纹),所以二值化问题是一个既关键又难以很好解决的问题。本文以关于二值化技术的综述性文献[9][10][11][12][13][14]为基础,对二值化技术及其相关问题进行讨论,同时,针对支票自识别系统的具体特点,经过研究和总结,本文提出了一种基于直方图最大梯度值的、用于整票二值化的算法;该算法较好的满足了支票识别系统预处理中整票二值化的需要。本文的贡献主要有以下几个方面:总结了支票自动化处理系统实现的三种模式;介绍、总结了多个经典二值化算法;利用直线检测结果等多个定量标准来评价二值化算法的好坏;研究了图像扫描的分辨率与二值化处理之间的关系。本文的主要创新点在于:(1)提出了一种用于整票二值化的算法。该算法基于直方图的最大梯度值,具有简单、高效、可靠的特点,能够较好的满足支票自动化识别系统中整票二值化的需要。(2)将直线检测结果用于对二值化算法效果的评价。此种定量的评价方式能够更好的评价、反映二值化结果对后继处理(直线检测)的影响。