论文题目: 低质量文本图像OCR技术的研究
论文类型: 博士论文
论文专业: 计算机系统结构
作者: 孙羽菲
导师: 李国杰
关键词: 文字识别,低质量文本,模式识别,图像处理,灰度图像,二值化,切分,识别,连通区域,种子区域增长,地形特征,相似汉字
文献来源: 中国科学院研究生院(计算技术研究所)
发表年度: 2005
论文摘要: 本论文对低质量文本图像的OCR技术进行了深入的研究,目标就是从理论,算法和应用三个层次上研究低质量文本图像的高性能识别问题。研究工作主要包括以下几个方面:首先分析论述了低质量文本灰度图像条件下,文字识别与人的认知、经典人工智能问题、以及二值图像识别技术之间的关系,对低质量文本图像OCR技术的研究方向提出了有别于传统的观点和看法。在上述理论框架的指导下,结合低质量文本自身的特点和规律,设计了一个低质量文本图像的识别流程,并在各主要步骤给出了实用高效的算法,主要有:基于连通区域的层次结构切分算法:不同于传统的先行列切分,再字切分的算法过程,本方法采用了由小到大、自底向上的切分策略。通过连通区域特征的变化规律找出适用于切分的最佳阈值,再根据先验知识和启发式规则,对连通区域做适当的合并分割操作,最后得到最优的切分结果。实验表明,该方法对于低质量文本图像能够取得令人满意的切分效果。基于地形特征的种子区域增长算法:基于确定点和关键点概念,利用像素地形特征自动的选择种子点,通过一种改进的种子区域增长方法,从种子区域开始,依据一定的优先级规则,逐渐向其近邻点扩展,对单字灰度图像二值化,有效地获取了字符的结构信息。本方法与已有的二值化方法相比较,能够更好的保留有效的字符结构信息,提高了识别的正确率。基于不对称性的分类部分空间法:发现了相似字之间误识的不对称性,并对这种不对称现象的成因进行了细致的探讨和分析。基于这种不对称性,提出了一种分类部分空间方法来解决相似字的识别问题。相似字按其结构特点被分成若干基本类别,不同类别在相应的部分空间提取不同的特征进行比较,以达到正确识别相似字的目的。经百万字左右的文本测试表明,本文提出的方法对于不同质量文本的识别性能有不同程度的提高,尤其是对于质量比较低的文本(五十年代的文本数据),其识别正确率达
论文目录:
摘要
Abstract
第一章 引言
1.1 研究的理论意义
1.2 研究的应用背景
1.3 低质量文本图像
1.3.1 产生和存在的原因
1.3.2 当前OCR 技术存在的不足
1.4 本论文的贡献
1.5 本论文的组织
第二章 OCR 技术的研究和发展现状
2.1 OCR 技术概述
2.1.1 发展历史
2.1.2 系统流程
2.2 图像二值化方法
2.2.1 全局阈值
2.2.2 局部阈值
2.3 切分方法
2.3.1 经典切分方法
2.3.2 连通区域法
2.3.3 基于识别的切分方法
2.3.4 整体切分法
2.3.5 灰度图像的切分方法
2.4 特征提取方法
2.4.1 二值特征提取
2.4.2 灰度特征提取
2.5 本章小结
第三章 低质量图像OCR 技术的理论框架
3.1 文本图像认知的初探
3.1.1 文本图像的二值本质
3.1.2 人认知文本图像的特点
3.1.3 低质量文本图像识别的难点
3.2 文本识别与经典人工智能问题
3.3 研究的基本观点
3.3.1 识别最终是二值的
3.3.2 二值化不是统一的
3.4 技术路线
3.4.1 切分的解决方案
3.4.2 单字识别的解决方案
3.5 本章小结
第四章 基于连通区域的层次结构切分算法
4.1 灰度分级
4.1.1 直方图均衡法
4.1.2 级数的选取
4.2 层次结构的建立
4.3 确定主层次
4.3.1 连通域数目的变化规律
4.3.2 连通域覆盖率的变化规律
4.4 后处理
4.4.1 合并
4.4.2 分割
4.5 实验分析
4.5.1 评测指标
4.5.2 实验数据和结果
4.6 本章小结
第五章 基于地形特征的种子区域增长算法
5.1 种子区域增长算法
5.1.1 算法描述
5.1.2 应用于文本图像的局限性
5.2 地形特征的提取
5.2.1 主要正交方向
5.2.2 几何特征
5.2.3 地形特征归类
5.3 基于地形特征的改进SRG 算法
5.3.1 初始化
5.3.2 种子点的选择
5.3.3 区域增长
5.3.4 后处理
5.4 实验结果和分析
5.4.1 二值化结果的比较
5.4.2 应用于识别的评测
5.5 本章小结
第六章 相似字识别的研究
6.1 相似字
6.1.1 相似字的定义
6.1.2 相似字对识别的影响
6.2 相似字误识的不对称性
6.2.1 不对称现象
6.2.2 成因分析
6.3 已有算法存在的问题
6.4 基于不对称性的分类部分空间法
6.4.1 基本类别
6.4.2 不对称性在算法中的应用
6.4.3 算法流程
6.5 实验结果和分析
6.6 本章小结
第七章 系统性能分析评测
7.1 低质量文本图像的OCR 流程
7.2 实验数据
7.3 实验结果和分析
7.4 本章小结
第八章 结束语
8.1 本文工作总结
8.2 下一步研究方向
参考文献
致谢
作者简介
发布时间: 2006-12-27
参考文献
- [1].数字视频中的文本分割的研究[D]. 许剑峰.华南理工大学2005
- [2].视频文本的提取[D]. 章东平.浙江大学2006
- [3].现代信息检索中的文本分类及图像恢复研究[D]. 刘涛.北京邮电大学2006
- [4].复杂场景文本识别技术研究[D]. 杨春.北京科技大学2018
- [5].近重复文本图像匹配研究[D]. 刘丽.华东师范大学2014
- [6].文本图像鲁棒认证技术研究[D]. 谭利娜.湖南大学2012
- [7].自然场景中文本识别技术研究及实现[D]. 吴锐.哈尔滨工业大学2010
- [8].自然场景图像文本信息提取的理论与方法[D]. 张昕.清华大学2014
- [9].几种图形图像压缩方法[D]. 孙日明.大连理工大学2013
- [10].文本载体信息隐藏及相关技术研究[D]. 蒋斌.解放军信息工程大学2008
相关论文
- [1].自然图像中文字检测与识别研究[D]. 姚聪.华中科技大学2014
- [2].数字、字符识别及其应用研究[D]. 文颖.上海交通大学2009
- [3].自然场景中文本识别技术研究及实现[D]. 吴锐.哈尔滨工业大学2010
- [4].文档图象版面理解的研究[D]. 刘建胜.重庆大学2002
- [5].多类小字符集自适应字符识别技术及系统的研究[D]. 彭健.重庆大学2002
- [6].小类别无限制手写体汉字识别研究[D]. 朱宁波.南京理工大学2004
标签:文字识别论文; 低质量文本论文; 模式识别论文; 图像处理论文; 灰度图像论文; 二值化论文; 切分论文; 识别论文; 连通区域论文; 种子区域增长论文; 地形特征论文; 相似汉字论文;