论文摘要
随着网络通信技术和多媒体技术的快速发展,文本图像被广泛应用于各个方面。如何从与日俱增的海量分布式信息系统中有效提取文本图像,并转换为便于检索、传输、保存和携带的电子文档,实现办公自动化,文本图像自动分析已成为一个亟待解决的课题。作为文本图像自动分析的重要分支,文本图像的文种自动识别技术已成为一个受到广泛关注的研究课题。本文主要研究印刷体文本图像文种识别技术,所做的工作包括;1、提出一种动态阈值文本行投影算法。与灰度投影算法相比,该算法减小了字体笔划粗细对识别结果的影响,对中文和字母文字(英文,俄文)两大类文字的识别率有一定提高。2、通过基于Gabor函数的多通道滤波纹理分析方法提取文本图像的全局特征,本文使用支持向量机(SVM)建立分类器,实现了文本图像的文种识别。该算法对文本图像含噪、倾斜、文字笔划残缺等质量退化现象,具有较强鲁棒性。3、在实现基于小波变换文种识别的基础上,以小波对数能量为特征构成了一种改进的基于小波能量的文种识别方法。实验结果表明,对中、日、韩、英、俄、阿拉伯六种文字进行识别,总体识别效果比较理想。4、提出一种基于分形模型的文种识别方法。该方法将文本图像看作多重分形集,建立多重分形模型计算文本图像的广义维数谱,以此来进行文种识别。在文字大小、文本行间距相差较大的情况下,基于分形模型的识别算法效果较好。
论文目录
表目录图目录摘要ABSTRACT第一章 绪论1.1 文本图像分析综述1.1.1 文本图像特征1.1.2 文本图像分析1.2 文本图像文种识别技术1.2.1 基于统计特征的文种识别1.2.2 基于纹理特征的文种识别1.3 选题的意义及本文主要工作1.3.1 选题的意义1.3.2 本文主要工作第二章 动态阈值文本行投影法2.1 文本行投影算法2.2 动态阈值投影法2.3 实验结果及分析2.4 本章小结第三章 基于Gabor滤波的文种识别方法3.1 Gabor滤波原理3.1.1 人类生理学视觉基础3.1.2 测不准原理3.1.3 Gabor滤波器3.2 基于Gabor滤波的文种识别方法3.2.1 特征的选取3.2.2 算法的鲁棒性分析3.2.3 分类器选择3.3 实验结果及分析3.4 本章小结第四章 基于小波对数能量的文种识别方法4.1 小波变换概念及快速算法4.1.1 小波变换概念4.1.2 多分辨分析和Mallat算法4.2 基于小波能量的文种识别方法4.3 基于小波对数能量的文种识别方法4.3.1 算法描述4.3.2 小波对数能量特征提取与文种识别过程4.3.3 实验结果及分析4.4 本章小结第五章 基于分形模型的文种识别方法5.1 分形概念及分形维数5.1.1 分形概念5.1.2 计算分形维数的基本模型5.1.3 多重分形5.2 基于分形模型的文种识别5.3 特征选取及流程5.4 实验结果及分析5.5 本章小结结束语参考文献作者简历 攻读硕士学位期间完成的主要工作致谢
相关论文文献
标签:文本图像论文; 文种识别论文; 投影论文; 变换论文; 小波变换论文; 分形维数论文;