有限集合污损汉字字符的识别

有限集合污损汉字字符的识别

论文摘要

有限集合污损汉字字符识别是汉字识别中具有重要意义的研究课题,它在汽车牌照字符识别、身份证件字符识别等方面发挥了很大作用。完整的印刷体汉字识别已经取得很好的成绩,但对于有污损的有限集合汉字字符识别,目前还很少有人做这方面研究,所以具有很大的研究价值和实用意义。本系统处理的对象是扫描得到的有一定程度污损的汉字,总共一百个样本,整个系统分为以下几个步骤:1、汉字图象的预处理。本系统的实验对象比较清晰,没有太多噪声干扰,所以用邻域(均值)滤波器进行平滑去噪,采用全局阈值法中的双峰法进行图像二值化,并根据图像的特点,对字符进行了大小和位置的线性规范化。2、在字符细化部分,提出了一种基于数学形态学的改进的细化算法。在形态学细化的基础上,提出了针对丁字部位笔划细化规则,解决了传统形态学细化存在的丁字笔划部位出现凹陷畸变的问题;还提出了端点-三岔点的跟踪消除算法,有效的消除了原算法细化后产生的毛刺。实验结果证明了此算法的有效性。3、字符的特征提取,简单介绍了常用的特征提取算法。在细化的基础上提取了字符的笔划数目及笔划间相互关系做为特征,并建立了特征向量矩阵。4、在识别阶段,本文采用了双层串行分类器结构,将有限字符集按结构的不同分为三类,即左右、上下和独立三类,并对左右和上下结构的字体按照标准部首进行粗分类,建立了子集。在细分类阶段,分三种情况分别在各类子字库中以待识别汉字或部首为基准按字符的特征向量矩阵进行匹配。本系统的训练和测试样本共一百个,所有的测试样本都有一定程度的污染,识别正确率为94%。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究的背景和现状
  • 1.2 本系统的主要工作
  • 第二章 预处理
  • 2.1 灰度图像的平滑
  • 2.1.1 线性平滑滤波器
  • 2.1.2 中值滤波器
  • 2.1.3 低通滤波器
  • 2.1.4 自适应滤波器
  • 2.1.5 本系统用的滤波方法
  • 2.2 二值化
  • 2.2.1 全局阈值法
  • 2.2.2 局部阈值法
  • 2.2.3 动态阈值二值化方法
  • 2.2.4 本文所使用的二值化方法
  • 2.3 规范化
  • 2.3.1 线性规范化
  • 2.3.1.1 位置规范化
  • 2.3.1.2 大小规范化
  • 2.3.2 非线性规范化
  • 2.4 本章小结
  • 第三章 汉字细化
  • 3.1 主要细化算法概述
  • 3.1.1 基本知识
  • 3.1.1.1 八邻域及像素命名
  • 3.1.1.2 边缘点、分裂点、分枝点及端点
  • 3.1.1.3 多重像素及连接数
  • 3.1.2 Hilditch 细化算法
  • 3.1.3 Deutsch 细化算法
  • 3.1.4 轮廓跟踪细化算法
  • 3.2 本文提出的改进细化算法
  • 3.2.1 传统的数学形态学细化算法
  • 3.2.2 本文中的细化算法分析
  • 3.2.2.1 T 型笔划拐点细化算法分析
  • 3.2.2.2 端点-三叉点的毛刺跟踪消除算法
  • 3.2.3 实验结果及分析
  • 第四章 特征提取
  • 4.1 特征提取概念
  • 4.2 结构特征提取方法
  • 4.2.1 字符的层次轮廓特征提取方法
  • 4.2.2 特征点特征
  • 4.3 统计特征提取方法
  • 4.3.1 笔划密度特征提取方法
  • 4.3.2 区域特征提取方法
  • 4.3.3 几何矩特征提取法
  • 4.3.4 纹理特征
  • 4.4 统计特征与结构特征相结合的特征提取方法
  • 4.4.1 基于小波弹性网格的特征提取
  • 4.4.2 四平面笔划穿透数目特征
  • 4.4.3 基于方向线素的特征
  • 4.4.4 基于隐马尔可夫型的特征
  • 4.5 本系统采用的特征提取算法
  • 4.5.1 四种笔划平面的标记
  • 4.5.2 笔段提取
  • 4.5.3 特征向量的生成
  • 第五章 分类与识别
  • 5.1 常用的分类器
  • 5.1.1 距离分类器
  • 5.1.2 人工神经网络分类器(ANN 分类器)
  • 5.1.3 支持向量机分类器(SVM 分类器)
  • 5.1.4 基于模糊数学的识别方法
  • 5.1.5 小波分析粗分类
  • 5.2 粗分类
  • 5.2.1 基于结构信息的粗分类
  • 5.2.2 基于统计信息的粗分类
  • 5.3 本系统的分类方法
  • 5.3.1 本系统的汉字粗分类方法
  • 5.3.2 本系统采用的细分类方法
  • 第六章 识别结果
  • 第七章 总结与展望
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 相关论文文献

    • [1].刍议科技图书中的汉字字符排序[J]. 科技与出版 2011(01)
    • [2].微博互动在虚拟与现实之间[J]. 中国青年 2010(24)
    • [3].Excel数据提取实例两则[J]. 电脑迷 2015(12)
    • [4].一种改进的汉字字符识别法[J]. 四川大学学报(自然科学版) 2014(05)
    • [5].汉字“表意功能”的内涵及演变[J]. 读与写(教育教学刊) 2008(03)
    • [6].基于字符连通域特征的车牌汉字字符识别技术[J]. 测试技术学报 2011(01)
    • [7].基于特征统计的车牌非汉字字符识别方法[J]. 广西师范学院学报(自然科学版) 2009(04)
    • [8].秦俑密码[J]. 金色年华 2008(01)
    • [9].Vega环境下一种汉字字符显示方法[J]. 指挥信息系统与技术 2011(01)
    • [10].Li-Hopfield神经网络用于汉字字符识别[J]. 南京信息工程大学学报(自然科学版) 2010(01)
    • [11].本刊“教师论坛”栏目征稿启事[J]. 英语画刊(高级版) 2013(01)
    • [12].基于FCM和组合神经网络的车牌汉字字符识别方法[J]. 交通信息与安全 2010(03)
    • [13].基于正交Gegenbauer矩的车牌汉字字符识别[J]. 武汉大学学报(工学版) 2008(01)
    • [14].快速模糊检索在大型数据库中的实现[J]. 电脑编程技巧与维护 2012(16)
    • [15].本刊“教师论坛”栏目征稿启事[J]. 英语画刊(高级版) 2013(11)
    • [16].基于OpenGL ES的汉字显示方法[J]. 无线互联科技 2012(07)
    • [17].军报微博语言具有的特征[J]. 军事记者 2014(06)
    • [18].谈“形声兼会意”之所指及相关问题[J]. 信阳师范学院学报(哲学社会科学版) 2011(01)
    • [19].焦应奇:艺术作为思想的出口[J]. 当代艺术与投资 2009(04)
    • [20].征稿启事[J]. 英语画刊(高级版) 2014(04)
    • [21].略论古汉语教学中汉字形训问题[J]. 现代语文(语言研究版) 2013(07)
    • [22].一种GSM短消息通信编码方法的设计[J]. 科技创新与应用 2012(32)
    • [23].基于DSP+FPGA的图形显示控制系统[J]. 电子科技 2013(03)
    • [24].无存贮音码汉字字符串的音码反查实现技术[J]. 中文信息学报 2009(01)
    • [25].趣味打字游戏的设计与实现[J]. 电脑编程技巧与维护 2013(04)
    • [26].现代汉字字符切分的分离性原则和理据性原则[J]. 汉字文化 2009(05)

    标签:;  ;  ;  ;  ;  ;  

    有限集合污损汉字字符的识别
    下载Doc文档

    猜你喜欢