论文摘要
文档的数字化是建设信息化社会的迫切需要,作为转换工具的OCR(Optical Character Recognition,光学字符识别)技术已得到广泛应用。随着数字成像设备的普及,OCR技术开始进入视觉文档图像这一领域。本文针对视觉文档图像的光学失真进行校正,主要包括椒盐噪声的去除、消除图像模糊、曝光不良的处理、积厚阴影的消除和单幅图像的超分辨率探讨五个组成部分。主要工作如下:对于文档图像中存在的椒盐噪声,改进了基于笔画特性的椒盐噪声处理方法。改进后的算法不仅不会产生文字模糊或笔画丢失,而且能有效适应多语种文字的图文混排,合理进行阈值判断,有效去除文档图像中的椒盐噪声。对于模糊的文档图像,改进了提取文字骨架来处理模糊的算法。该算法根据文档图像的特性,将常见字体分为两大类,并对每类字体设计不同的求阈值方法,改进后的算法,能够有效地消除图像的模糊。对于曝光不良的视觉文档图像,改进了基于目标和背景分离的目标增强算法。改进后的算法对含版画类插图的视觉文档图像,先利用二值化和数学形态学方法对插图位置进行判定,再对插图区和剩余区分别进行不同的增强处理,实验结果表明,较之改进前,能更好地处理视觉文档图像。对于视觉文档图像中的积厚阴影,本文实现了已有的“借鉴视觉图像曝光不良的校正”来处理积厚阴影的算法。实验表明,该算法能有效去除视觉文档图像中的积厚阴影。针对小字号文字的OCR识别率不高的情况,本文提出一种先进行插值放大,再利用小波分解,并对图像的高频信息进行增强,最后小波逆分解合成的方法,该方法经实验验证,能有效地对放大后的文字边缘进行增强,提高OCR识别率。
论文目录
相关论文文献
- [1].基于结构化局部边缘模式的文档图像分类[J]. 厦门大学学报(自然科学版) 2013(03)
- [2].基于纹理梯度的文档图像的倾斜校正方法[J]. 计算机仿真 2009(03)
- [3].基于形态学和霍夫变换的文档图像倾斜检测[J]. 南京理工大学学报(自然科学版) 2009(02)
- [4].一种中文文档图像中检索方法研究[J]. 电脑知识与技术 2009(26)
- [5].连通域结合重叠度的维吾尔文档图像文字切分[J]. 计算机工程与设计 2016(07)
- [6].文档图像屏幕适配方法中的行切问题研究[J]. 计算机应用与软件 2012(06)
- [7].改进的文档图像扭曲校正方法[J]. 计算机工程 2011(01)
- [8].基于形态学的文档图像透视校正算法[J]. 光电子.激光 2009(09)
- [9].基于手持相机的文档图像拼接算法[J]. 中国图象图形学报 2009(08)
- [10].一种复杂版面扭曲文档图像快速校正方法[J]. 计算机应用与软件 2016(06)
- [11].基于投影直方图的文档图像快速匹配研究[J]. 计算机技术与发展 2011(07)
- [12].基于文档图像的贝叶斯重建算法仿真研究[J]. 计算机仿真 2011(09)
- [13].综合文字和非文字区域特征的文档图像检索[J]. 计算机工程与应用 2010(12)
- [14].基于特征的文档图像检索[J]. 计算机工程 2009(22)
- [15].提高影像文档图像质量的预处理研究[J]. 科技信息 2009(31)
- [16].基于文本布局块距离度量的文档图像检索[J]. 电子科技 2017(09)
- [17].基于逆向工程的扭曲文档图像恢复[J]. 计算机工程与设计 2016(04)
- [18].基于层级匹配的维吾尔文关键词文档图像检索[J]. 计算机工程与设计 2020(04)
- [19].基于行间留白的文档图像校正方法[J]. 计算机工程 2017(04)
- [20].一种基于页眉线的扭曲文档图像快速校正方法[J]. 图学学报 2016(01)
- [21].面向电子助视系统的文档图像拼接算法研究[J]. 计算机测量与控制 2018(02)
- [22].一种基于梯度差的文档图像文本行检测算法[J]. 微型机与应用 2011(18)
- [23].纹理特征加权融合的中亚多文种文档图像文种识别[J]. 计算机工程与应用 2017(20)
- [24].树聚类方法在文档图像检索中的应用[J]. 科技资讯 2009(15)
- [25].连体段特征聚类的维吾尔文文档图像单词切分[J]. 计算机工程与设计 2018(03)
- [26].基于形态学梯度算法的维文文档图像单词切分[J]. 计算机工程与设计 2019(09)
- [27].文档图像几何畸变快速校正的新方法[J]. 计算机应用 2010(12)
- [28].动态规划算法在手机拍照文档图像中的应用[J]. 北京邮电大学学报 2017(04)
- [29].基于三维模型的二维文档图像提取与识别[J]. 计算机工程与设计 2017(10)
- [30].多特征融合的文档图像版面分析[J]. 中国图象图形学报 2020(02)