印刷体文本图像的文种识别研究

印刷体文本图像的文种识别研究

论文摘要

随着网络通信技术和多媒体技术的快速发展,文本图像被广泛应用于各个方面。如何从与日俱增的海量分布式信息系统中有效提取文本图像,并转换为便于检索、传输、保存和携带的电子文档,实现办公自动化,文本图像自动分析已成为一个亟待解决的课题。作为文本图像自动分析的重要分支,文本图像的文种自动识别技术已成为一个受到广泛关注的研究课题。本文主要研究印刷体文本图像文种识别技术,所做的工作包括;1、提出一种动态阈值文本行投影算法。与灰度投影算法相比,该算法减小了字体笔划粗细对识别结果的影响,对中文和字母文字(英文,俄文)两大类文字的识别率有一定提高。2、通过基于Gabor函数的多通道滤波纹理分析方法提取文本图像的全局特征,本文使用支持向量机(SVM)建立分类器,实现了文本图像的文种识别。该算法对文本图像含噪、倾斜、文字笔划残缺等质量退化现象,具有较强鲁棒性。3、在实现基于小波变换文种识别的基础上,以小波对数能量为特征构成了一种改进的基于小波能量的文种识别方法。实验结果表明,对中、日、韩、英、俄、阿拉伯六种文字进行识别,总体识别效果比较理想。4、提出一种基于分形模型的文种识别方法。该方法将文本图像看作多重分形集,建立多重分形模型计算文本图像的广义维数谱,以此来进行文种识别。在文字大小、文本行间距相差较大的情况下,基于分形模型的识别算法效果较好。

论文目录

  • 表目录
  • 图目录
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 文本图像分析综述
  • 1.1.1 文本图像特征
  • 1.1.2 文本图像分析
  • 1.2 文本图像文种识别技术
  • 1.2.1 基于统计特征的文种识别
  • 1.2.2 基于纹理特征的文种识别
  • 1.3 选题的意义及本文主要工作
  • 1.3.1 选题的意义
  • 1.3.2 本文主要工作
  • 第二章 动态阈值文本行投影法
  • 2.1 文本行投影算法
  • 2.2 动态阈值投影法
  • 2.3 实验结果及分析
  • 2.4 本章小结
  • 第三章 基于Gabor滤波的文种识别方法
  • 3.1 Gabor滤波原理
  • 3.1.1 人类生理学视觉基础
  • 3.1.2 测不准原理
  • 3.1.3 Gabor滤波器
  • 3.2 基于Gabor滤波的文种识别方法
  • 3.2.1 特征的选取
  • 3.2.2 算法的鲁棒性分析
  • 3.2.3 分类器选择
  • 3.3 实验结果及分析
  • 3.4 本章小结
  • 第四章 基于小波对数能量的文种识别方法
  • 4.1 小波变换概念及快速算法
  • 4.1.1 小波变换概念
  • 4.1.2 多分辨分析和Mallat算法
  • 4.2 基于小波能量的文种识别方法
  • 4.3 基于小波对数能量的文种识别方法
  • 4.3.1 算法描述
  • 4.3.2 小波对数能量特征提取与文种识别过程
  • 4.3.3 实验结果及分析
  • 4.4 本章小结
  • 第五章 基于分形模型的文种识别方法
  • 5.1 分形概念及分形维数
  • 5.1.1 分形概念
  • 5.1.2 计算分形维数的基本模型
  • 5.1.3 多重分形
  • 5.2 基于分形模型的文种识别
  • 5.3 特征选取及流程
  • 5.4 实验结果及分析
  • 5.5 本章小结
  • 结束语
  • 参考文献
  • 作者简历 攻读硕士学位期间完成的主要工作
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    印刷体文本图像的文种识别研究
    下载Doc文档

    猜你喜欢