Print

图像分割在文档图像处理中的应用

论文摘要

文档图像在办公自动化、数字图书馆、电子商务、电子政务、教育等项目中已经广泛应用,在这些应用中,纸质文档通常采用扫描方式得到数字化文档图像进而进行存储和数据处理,纸质文档的信息化是提高数据管理效率、查询效率的重要途径之一。文档图像的处理一般包括:图像预处理、图像分割、图像识别。本文研究了文档图像的分割问题,将图像的文本块与自然图像分离,实现文本图像的行切分和字符切分。基于文档图像的纹理及结构特点,本文先对文档图像进行预处理,使用HOUGH变换检测、定位文档图像的行信息和倾斜角,进行图像的校正,然后使用连通域算法对图像中的目标进行标记,利用文档图像的结构特征和统计特征分割图像,获得纯文本区域,字符的分割使用了连通域、字符结构特征分析等方法,实验数据说明了本文算法的有效性和鲁棒性。本文的工作主要体现在以下几个方面:(1)对自然图像和纯文本文档图像的纹理特征进行了分析,通过量化指标说明文档图像与自然图像之间的差异性。(2)针对文档图像的特点,对文档图像的预处理进行了分析和比较,给出了图像预处理算法的流程图。(3)提出一种新的文档图像分割方法,使用图像的边缘连通域目标数的统计特征分割图像,给出了具体的实现算法。(4)字符分割使用了多种方法,具有更好的实用性。(5)指出本文算法的不足,提出改进建议,对进一步的研究进行了展望。

论文目录

  • 中文摘要
  • 英文摘要
  • 1 绪论
  • 1.1 图像分割的研究背景及意义
  • 1.2 文档图像分割的国内外现状
  • 1.3 本文的结构安排
  • 2 文档图像处理
  • 2.1 文档图像的生成
  • 2.1.1 文档图像数字化
  • 2.1.2 文档图像的预处理
  • 2.2 文档图像的特征
  • 2.2.1 统计特征
  • 2.2.2 变换系数特征
  • 3 文档图像预处理算法
  • 3.1 图像的灰度化
  • 3.2 文档图像背景估计及二值化
  • 3.3 噪声处理
  • 3.4 图像预处理算法的流程图
  • 4 图像分割算法
  • 4.1 常用的图像分割方法
  • 4.1.1 传统的图像分割方法
  • 4.1.2 现代图像分割方法
  • 4.2 图像的倾斜校正算法
  • 4.3 文档图像分割算法
  • 4.3.1 常用文档图像的分割方法
  • 4.3.2 文档图像分割算法
  • 4.3.3 文档图像分割实验结果
  • 4.4 字符分割算法
  • 5 总结与展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/56b53033890ba904929b9789.html