印刷体文本图像文种识别技术研究

印刷体文本图像文种识别技术研究

论文摘要

随着网络通信技术和信息处理技术的迅速发展,文本图像逐渐成为了信息交流的重要媒介。文本图像是由文件、档案等文字资料通过图文扫描仪、数码相机等图像数据采集设备生成的,以静止图像编码方法存储的数字图像,载荷有丰富的文字信息、图像信息、格式信息等重要内容。随着国家之间交流的日益频繁,全球化步伐的逐渐加快,多种语言文字的文本图像需要进行识别和处理。文本图像的文种识别是对以图像形式呈现、由不同语言文字构成的图像,提取能够用于计算机识别的底层特征,实现文种的自动分类,对于有效提取文本图像中的信息具有十分重要的意义。本文对文本图像文种识别技术进行了研究,根据各文种文本图像在笔画方向分布、纹理方向分布以及纹理组成结构上存在差异的特点,提出了多种有效的识别算法,所做的主要工作如下:1.介绍了文本图像文种识别技术的发展历史和研究现状,总结和分析了文种识别技术现有的成果,指出了需要解决的问题,深入研究了文本图像的结构特点和纹理特征。2.提出一种基于笔画方向直方图的文种识别方法。根据各文种文本图像在笔画方向分布上存在的差异,利用笔画的边缘像素对笔画方向进行描述,统计边缘像素的方向分布,提取反映各文种笔画方向分布的特征,并采用SVM作为分类器实现文种自动分类。实验结果表明,该方法具有较好的稳定性,在训练样本数较少的情况下也有较好的识别结果。3.提出一种基于Brushlet变换的文种识别方法。Brushlet变换具有很强的方向性,图像经过Brushlet分解后,每个子带都能较好的反映图像相应方向的纹理分布。该方法根据各文种文本图像在不同方向的纹理分布上存在差异的特点,利用Brushlet良好的方向性对图像进行分解,提取分解后上半部分的子带的能量作为特征进行文种识别,取得了较好的识别结果。4.提出一种基于基本图像特征的文种识别方法。基本图像特征是一种多尺度纹理分析方法,它将图像的局部对称结构划分为7种类型,并用其描述纹理。根据各文种文本图像在纹理结构上存在差异的特点,按照图像纹理分析结构方法的观点,将基本图像特征划分的7种图像局部对称结构类型,看作构成图像纹理的7种纹理基元,并以这7种纹理基元的组成比例及其共生矩阵作为描述纹理结构的特征进行文种识别。该方法有较好的识别结果,对图像质量退化有较好的鲁棒性。最后,对本文工作进行了总结,并对文本图像文种识别技术的发展和研究进行了展望。

论文目录

  • 表目录
  • 图目录
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 文本图像分析
  • 1.2.1 文本图像特征
  • 1.2.2 文本图像分析系统
  • 1.3 文种识别研究现状
  • 1.3.1 基于符号匹配的文种识别
  • 1.3.2 基于统计特征的文种识别
  • 1.3.3 基于纹理特征的文种识别
  • 1.3.4 小结
  • 1.4 本文研究内容
  • 第二章 基于笔画方向直方图的文种识别
  • 2.1 文本图像文字笔画分析
  • 2.2 笔画方向直方图
  • 2.2.1 Canny 边缘检测
  • 2.2.2 边缘方向直方图
  • 2.2.3 笔画方向直方图
  • 2.3 基于笔画方向直方图的文种识别
  • 2.3.1 特征提取
  • 2.3.2 分类器
  • 2.4 实验用文本图像库
  • 2.5 实验结果与性能分析
  • 2.6 本章小结
  • 第三章 基于Brushlet 变换的文种识别
  • 3.1 Brushlet 变换理论
  • 3.1.1 一维Brushlet 基构造
  • 3.1.2 二维Brushlet 基构造
  • 3.1.3 Brushlet 变换的快速算法
  • 3.2 基于Brushlet 变换的文种识别
  • 3.2.1 图像的Brushlet 变换
  • 3.2.2 特征提取
  • 3.3 实验结果与性能分析
  • 3.4 本章小结
  • 第四章 基于基本图像特征的文种识别
  • 4.1 基本图像特征
  • 4.1.1 图像局部对称性分析
  • 4.1.2 高斯滤波器组
  • 4.1.3 基本图像特征
  • 4.1.4 基于基本图像特征的纹理分类
  • 4.2 基于基本图像特征的文种识别
  • 4.2.1 图像纹理分析的结构方法
  • 4.2.2 特征提取
  • 4.3 实验结果与性能分析
  • 4.4 本章小结
  • 结束语
  • 一、全文总结
  • 二、展望
  • 参考文献
  • 作者简历 攻读硕士学位期间完成的主要工作
  • 致谢
  • 相关论文文献

    • [1].试论意见的文种品格[J]. 秘书 2016(12)
    • [2].殊途同归:关于不同文种“互联互通”的探析[J]. 写作(上旬刊) 2017(06)
    • [3].“意见”公文文种异化现象分析——以《国务院公报》2010—2019年公文文本为例[J]. 档案管理 2020(06)
    • [4].公文文种误用错用现象及对策研究[J]. 写作(上旬刊) 2017(09)
    • [5].党政机关任免文种的历史演变及其偏误分析[J]. 办公室业务 2016(02)
    • [6].从文种的终极价值看报告的写作[J]. 应用写作 2015(04)
    • [7].计划和总结列入法定文种刍议[J]. 档案管理 2011(01)
    • [8].几种特殊情况下的文种选用[J]. 秘书 2010(03)
    • [9].请示文种研究现状综述[J]. 秘书 2018(02)
    • [10].文种使用中常见错误例析[J]. 秘书之友 2016(09)
    • [11].清末新文种“牍”的考释——以《南部档案》为线索[J]. 四川档案 2015(05)
    • [12].简述民国平行公文的演变兼论文种演进的规律[J]. 浙江档案 2013(08)
    • [13].关于“意见”文种的再认识[J]. 秘书之友 2011(03)
    • [14].公文写作中文种选择应注意的问题[J]. 无锡商业职业技术学院学报 2010(05)
    • [15].新疆多文种报刊的发展路径探析[J]. 新闻世界 2010(11)
    • [16].对“通知”文种使用范围的思考与商榷[J]. 档案管理 2017(02)
    • [17].文种三请范蠡[J]. 文史知识 2008(05)
    • [18].现行公文中任免功能的文种选择[J]. 办公室业务 2013(20)
    • [19].简析函与相关文种的错用[J]. 秘书 2011(07)
    • [20].“命令”文种的起源[J]. 陕西档案 2011(05)
    • [21].正确选用公文文种要把好“四道关”[J]. 应用写作 2020(10)
    • [22].也谈答复请示的文种使用问题——兼与刘心爽先生商榷[J]. 应用写作 2008(02)
    • [23].试谈公文写作中法定公文的文种选择[J]. 吉林广播电视大学学报 2014(02)
    • [24].论文种辨析在高校公文使用中的重要性[J]. 厦门广播电视大学学报 2010(04)
    • [25].创建文种学[J]. 档案与建设 2009(11)
    • [26].名不正则事不顺——公文文种选择常见错误例析[J]. 秘书工作 2016(05)
    • [27].浅析通知文种的功能及使用规范[J]. 办公室业务 2013(04)
    • [28].基于多小波变换的文本图像文种识别[J]. 电子设计工程 2011(15)
    • [29].“意见”文种在使用中的发展变化[J]. 新闻与写作 2009(06)
    • [30].公文标题结构规范辨析——从生造文种之争说起[J]. 秘书之友 2020(01)

    标签:;  ;  ;  ;  ;  

    印刷体文本图像文种识别技术研究
    下载Doc文档

    猜你喜欢