文档图像的文种识别系统

文档图像的文种识别系统

论文摘要

在当今时代,网络和多媒体技术迅猛发展,在促进了信息交换的同时,也带来了对信息的巨大需求。光学字符识别OCR作为计算机信息录入的一个重要技术,也得到了飞速发展。文种识别作为OCR技术的前端和基础,同时也是自动化处理工作中的重要部分,近年来得到了广泛的关注与研究。 本文设计和实现了一个文档图像的文种识别系统。该系统运用于我们的实际工作中,取得了较好的效果。该系统由预处理、版面分析、文种识别三大部分组成。本文的主要研究工作有: (1)图像预处理。预处理是图像处理中一项很重要的工作,预处理的质量直接影响后续工作的效果和成败。本文着重介绍我们改进的Hough变换方法,用于文档图像的倾斜校正。这种算法,通过以下措施减小了计算量:采用合适的量化角度,减小量化步长;选择子区域取代完整的图像,减小待处理的数据量;选取特征点集而不是处理区域全部像素,进一步减小待处理的数据量。最后,为了提高图像质量,不是简单地旋转而是用像素面积插值法进行倾斜的校正。 (2)采用投影法进行简单版面的分割。改进了常用的递归算法,使用多叉树取代二叉树算法,大大减小了冗余运算,降低了算法的复杂度。为了避开投影法对嵌入式等复杂版面分析中的失效,充分利用投影法简单快捷的优点,我们将投影法应用于区域提取和文字行的切分上。 (3)金字塔模型的版面分割。本文提出了一种新的基于形状的版面分析方法——基于金字塔模型的版面分割,解决了复杂版面分析问题。该方法符合人类视觉由粗到精的特点,我们改进了基于连通区的

论文目录

  • 摘要
  • 第一章 综述
  • 1.1 论文背景
  • 1.2 论文工作及组织结构
  • 第二章 Hough变换法倾斜校正
  • 2.1 Hough变换
  • 2.2 Hough变换的算法原理
  • 2.3 改进 Hough变换
  • 2.3.1 子区域的选取
  • 2.3.2 特征点集的确定
  • 2.4 像素面积插值法倾斜校正
  • 第三章 基于投影的简单版面分析
  • 3.1 投影
  • 3.2 基于投影的多分法算法原理
  • 3.3 多分算法的实现过程
  • 3.4 实验结果
  • 第四章 基于金字塔模型的复杂版面分析
  • 4.1 文档图像的金字塔模型
  • 4.2 基于金字塔模型的版面分割
  • 4.3 决策树的分析
  • 4.4 特征选择
  • 4.5 区域分类的实验结果
  • 第五章 凹度特征文种识别算法
  • 5.1 凹度的概念
  • 5.2 改进的凹度特征算法
  • 5.3 实验结果
  • 第六章 穿越次数法文种识别
  • 6.1 穿越次数的概念
  • 6.2 文字行穿越次数的计算
  • 6.3 实验结果
  • 第七章 基于小波纹理的文种识别
  • 7.1 算法原理
  • 7.2 决策器的改进
  • 7.3 实验结果
  • 第八章 总结
  • 8.1 论文完成的主要工作
  • 8.2 进一步需要解决的问题
  • 参考文献
  • 在校期间发表论文
  • 声明
  • 致谢
  • 相关论文文献

    • [1].基于结构化局部边缘模式的文档图像分类[J]. 厦门大学学报(自然科学版) 2013(03)
    • [2].基于纹理梯度的文档图像的倾斜校正方法[J]. 计算机仿真 2009(03)
    • [3].基于形态学和霍夫变换的文档图像倾斜检测[J]. 南京理工大学学报(自然科学版) 2009(02)
    • [4].一种中文文档图像中检索方法研究[J]. 电脑知识与技术 2009(26)
    • [5].连通域结合重叠度的维吾尔文档图像文字切分[J]. 计算机工程与设计 2016(07)
    • [6].文档图像屏幕适配方法中的行切问题研究[J]. 计算机应用与软件 2012(06)
    • [7].改进的文档图像扭曲校正方法[J]. 计算机工程 2011(01)
    • [8].基于形态学的文档图像透视校正算法[J]. 光电子.激光 2009(09)
    • [9].基于手持相机的文档图像拼接算法[J]. 中国图象图形学报 2009(08)
    • [10].一种复杂版面扭曲文档图像快速校正方法[J]. 计算机应用与软件 2016(06)
    • [11].基于投影直方图的文档图像快速匹配研究[J]. 计算机技术与发展 2011(07)
    • [12].基于文档图像的贝叶斯重建算法仿真研究[J]. 计算机仿真 2011(09)
    • [13].综合文字和非文字区域特征的文档图像检索[J]. 计算机工程与应用 2010(12)
    • [14].基于特征的文档图像检索[J]. 计算机工程 2009(22)
    • [15].提高影像文档图像质量的预处理研究[J]. 科技信息 2009(31)
    • [16].基于文本布局块距离度量的文档图像检索[J]. 电子科技 2017(09)
    • [17].基于逆向工程的扭曲文档图像恢复[J]. 计算机工程与设计 2016(04)
    • [18].基于层级匹配的维吾尔文关键词文档图像检索[J]. 计算机工程与设计 2020(04)
    • [19].基于行间留白的文档图像校正方法[J]. 计算机工程 2017(04)
    • [20].一种基于页眉线的扭曲文档图像快速校正方法[J]. 图学学报 2016(01)
    • [21].面向电子助视系统的文档图像拼接算法研究[J]. 计算机测量与控制 2018(02)
    • [22].一种基于梯度差的文档图像文本行检测算法[J]. 微型机与应用 2011(18)
    • [23].纹理特征加权融合的中亚多文种文档图像文种识别[J]. 计算机工程与应用 2017(20)
    • [24].树聚类方法在文档图像检索中的应用[J]. 科技资讯 2009(15)
    • [25].连体段特征聚类的维吾尔文文档图像单词切分[J]. 计算机工程与设计 2018(03)
    • [26].基于形态学梯度算法的维文文档图像单词切分[J]. 计算机工程与设计 2019(09)
    • [27].文档图像几何畸变快速校正的新方法[J]. 计算机应用 2010(12)
    • [28].动态规划算法在手机拍照文档图像中的应用[J]. 北京邮电大学学报 2017(04)
    • [29].基于三维模型的二维文档图像提取与识别[J]. 计算机工程与设计 2017(10)
    • [30].多特征融合的文档图像版面分析[J]. 中国图象图形学报 2020(02)

    标签:;  ;  ;  ;  ;  ;  ;  

    文档图像的文种识别系统
    下载Doc文档

    猜你喜欢