包装箱表面印刷体汉字识别算法研究

包装箱表面印刷体汉字识别算法研究

论文摘要

产品外包装上说明文字印刷的正确性对于商家和用户来说都是至关重要的。为了检验包装箱上说明文字的正确性,对包装箱上的印刷汉字进行识别算法的研究。印刷质量和摄像机成像等原因造成了包装箱文字图像质量比较差,使得传统的针对高质量汉字图像的识别方法无法直接应用到包装箱表面汉字识别当中。针对包装箱表面汉字图像,采用了两级汉字特征提取和分类方法。在对低质量汉字图像进行归一化的过程中,引入了高斯滤波和二值化方法,有效抑制了噪声污染和低对比度对归一化结果的干扰作用。粗分类阶段,针对归一化后汉字图像,采用Gabor滤波器提取高鲁棒性的汉字粗分类特征。应用Gabor滤波器旨在将汉字分解成“横撇竖捺”四个方向的笔划特征图,这就降低了Gabor滤波器的设计难度。对Gabor滤波结果进一步提取笔划穿越次数和低频DCT系数,形成最终的粗分类特征。实验证明采用K均值聚类可达到98%的粗分类识别率。细分类阶段,将Gabor滤波器对汉字图像的滤波结果与隐马尔可夫模型(HMM)结合起来,用一维HMM为二维汉字建立了模型,实现对汉字的细分类。HMM的状态对应“横撇竖捺”四个笔划特征图。从各个状态中获取观察序列时,提出了一种直观的量化方法。HMM状态和观察符号具有明确的物理意义简化了HMM参数的初始化选择。试验结果表明,Gabor滤波器和HMM的结合能够实现对低质量包装箱汉字图像的粗分类和细分类识别,两级综合识别率可达95%。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 课题的来源和意义
  • 1.2 汉字识别研究现状
  • 1.3 本文的主要工作和创新点
  • 2 汉字图像归一化方法
  • 2.1 归一化过程介绍
  • 2.2 实验结果及分析
  • 2.3 小结
  • 3 基于Gabor滤波器的笔划穿越次数DCT特征的汉字粗分类方法
  • 3.1 引言
  • 3.2 Gabor滤波器的定义与性质
  • 3.3 Gabor滤波器的参数选择
  • 3.4 粗分类特征的生成与粗分类方法
  • 3.5 实验结果及分析
  • 3.6 小结
  • 4 HMM在汉字特征细分类中的应用
  • 4.1 引言
  • 4.2 隐马尔可夫模型(HMM)
  • 4.3 HMM结构设计和参数初始化方法
  • 4.4 实验结果及分析
  • 4.5 小结
  • 5 总结与展望
  • 致谢
  • 硕士期间的研究成果
  • 参考文献
  • 相关论文文献

    • [1].印刷体汉字识别处理技术综述[J]. 计算机光盘软件与应用 2014(24)
    • [2].基于最短欧氏距离匹配的印刷体汉字识别[J]. 平顶山学院学报 2012(02)
    • [3].一种快速有效的印刷体汉字识别方法[J]. 华北电力大学学报(自然科学版) 2008(03)
    • [4].基于多引擎的印刷体汉字识别系统的设计[J]. 广西科学院学报 2011(04)
    • [5].印刷体汉字识别后处理方法的研究[J]. 中文信息学报 2009(06)
    • [6].基于BP神经网络的印刷体汉字识别[J]. 智库时代 2018(45)
    • [7].《平顶山学院学报》第27卷2012年总目次[J]. 平顶山学院学报 2012(06)
    • [8].网格笔划密度特征的OPCCR错误自动检测[J]. 四川大学学报(自然科学版) 2011(06)
    • [9].基于不可分小波变换与Zernike矩的印刷体汉字识别方法[J]. 计算机应用与软件 2018(04)

    标签:;  ;  

    包装箱表面印刷体汉字识别算法研究
    下载Doc文档

    猜你喜欢