文档图像在办公自动化、数字图书馆、电子商务、电子政务、教育等项目中已经广泛应用,在这些应用中,纸质文档通常采用扫描方式得到数字化文档图像进而进行存储和数据处理,纸质文档的信息化是提高数据管理效率、查询效率的重要途径之一。文档图像的处理一般包括:图像预处理、图像分割、图像识别。本文研究了文档图像的分割问题,将图像的文本块与自然图像分离,实现文本图像的行切分和字符切分。基于文档图像的纹理及结构特点,本文先对文档图像进行预处理,使用HOUGH变换检测、定位文档图像的行信息和倾斜角,进行图像的校正,然后使用连通域算法对图像中的目标进行标记,利用文档图像的结构特征和统计特征分割图像,获得纯文本区域,字符的分割使用了连通域、字符结构特征分析等方法,实验数据说明了本文算法的有效性和鲁棒性。本文的工作主要体现在以下几个方面:(1)对自然图像和纯文本文档图像的纹理特征进行了分析,通过量化指标说明文档图像与自然图像之间的差异性。(2)针对文档图像的特点,对文档图像的预处理进行了分析和比较,给出了图像预处理算法的流程图。(3)提出一种新的文档图像分割方法,使用图像的边缘连通域目标数的统计特征分割图像,给出了具体的实现算法。(4)字符分割使用了多种方法,具有更好的实用性。(5)指出本文算法的不足,提出改进建议,对进一步的研究进行了展望。
本文来源: https://www.lw50.cn/article/56b53033890ba904929b9789.html