自然场景中汉字识别关键技术研究

自然场景中汉字识别关键技术研究

论文摘要

自然场景中的文字蕴含着丰富的信息。自动地获取图像中的文字信息可以帮助人们更有效地理解图像和对图像进行存储、压缩、检索等进一步处理。本文对自然场景中汉字识别的关键技术作了研究。并在附录中给出了手机平台联机手写汉字数据库XD-MBOHD的建立方法。本文的主要工作如下:1.目前面向中文自然场景的文字定位识别研究中,没有公开、精确、通用的数据库,这是阻碍研究的一个瓶颈问题。为此,本文建立了西安电子科技大学自然场景文本定位与识别数据库(XDText L&R Database),设定了自然场景中文本的坐标、含义等真值,用于后继的文字定位及识别研究。2.自然场景文本定位后,会产生定位不准确,漏检,多个字符相连,倾斜等问题。针对这一情况,本文对自然场景的汉字识别预处理的算法进行研究,包括文本区域二值化,字符颜色的提取,颜色的聚类分析,字符的切分等,并对定位后文本区域合并的规则进行设计。3.研究了文字识别中特征提取与分类器集成方法,将欧氏距离分类器和神经网络分类器并行集成,通过设计的投票法则,使集成后的分类器具有自适应权值的功能,适应候选结果质量的变化。4.建立了手机平台联机手写汉字数据库XD-MBOHD,该数据库包括了汉字、数字、英文字母、常用标点符号等内容,该数据库的采集方式,还可扩展到在线签名识别,笔迹身份鉴定等领域。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 自然场景中汉字识别的研究意义
  • 1.2 自然场景中汉字识别研究现状
  • 1.2.1 自然场景汉字识别数据库的研究概述
  • 1.2.2 自然场景汉字识别的识别算法研究概述
  • 1.3 论文主要研究内容及安排
  • 第二章 自然场景文本定位与识别数据库的建立
  • 2.1 引言
  • 2.2 国内外自然场景文本数据库的研究比较
  • 2.2.1 中文自然场景文本数据库
  • 2.2.2 ICDAR 2003 OCR 数据库
  • 2.2.3 其他数据库
  • TEXTL&R Database 数据库的建立'>2.3 XDTEXTL&R Database 数据库的建立
  • 2.3.1 图像采集
  • 2.3.2 图像标定
  • 2.3.3 检查整改
  • 2.4 构建数据库成果
  • 2.5 本章小结
  • 第三章 自然场景中文字识别预处理
  • 3.1 自然场景中汉字识别问题分析
  • 3.2 字符提取
  • 3.2.1 文本定位区域字符颜色提取
  • 3.2.2 颜色聚类
  • 3.2.3 文本区域合并的规则
  • 3.2.4 字符二值化和前景提取
  • 3.3 带有倾斜矫正的字符切分
  • 3.3.1 字符的倾斜矫正
  • 3.3.2 字符的切分
  • 3.3.3 字符的切分和倾斜矫正的结合
  • 3.4 本章小结
  • 第四章 自然场景中汉字识别算法研究
  • 4.1 引言
  • 4.2 基于方向线素的特征提取
  • 4.2.1 字符归一化处理
  • 4.2.2 字符轮廓化
  • 4.2.3 方向线素的特征提取
  • 4.3 欧氏距离分类器
  • 4.4 神经网络分类器
  • 4.4.1 神经元示意图
  • 4.4.2 神经网络
  • 4.4.3 感知器的学习算法
  • 4.4.4 基于感知器模型的汉字识别
  • 4.5 欧氏距离分类器与神经网络分类器集成的汉字识别算法
  • 4.5.1 分类器集成概述
  • 4.5.2 欧氏距离与神经网络分类器集成的设计框架
  • 4.5.3 欧氏距离分类器与神经网络分类器的识别结果分析
  • 4.5.4 分类器集成设计的实现
  • 4.6 自然场景汉字识别系统示例
  • 4.7 本章小结
  • 第五章 总结与展望
  • 5.1 工作总结
  • 5.2 工作展望
  • 致谢
  • 参考文献
  • 附录A 汉字识别手写数据库XD-MBOHD的建立
  • A.1 汉字识别手写数据库的研究现状
  • A.2 XD-MBOHD 的特点
  • A.3 XD-MBOHD 的建立
  • A.3.1 手写字符采集软件Writfun
  • A.3.2 手写字符采集软件AnycallWriting
  • A.3.3 手写样本的后期处理
  • A.4 基于移动终端的联机手写识别系统简介
  • A.5 本章小结
  • 附录A 参考文献
  • 相关论文文献

    • [1].浅析汉字识别技术在档案管理工作中的应用[J]. 赤子(上中旬) 2015(11)
    • [2].档案管理工作中的汉字识别技术的应用浅析[J]. 黑龙江档案 2015(04)
    • [3].汉字识别技术在档案管理工作中的应用初探[J]. 内蒙古教育 2010(12)
    • [4].汉字识别技术在档案管理中的应用[J]. 民营科技 2014(03)
    • [5].汉字识别技术的探讨[J]. 兰台世界 2013(S1)
    • [6].浅析汉字识别技术在档案管理工作中的应用[J]. 黑龙江科技信息 2011(03)
    • [7].浅析汉字识别技术在档案管理工作中的应用[J]. 价值工程 2010(03)
    • [8].浅析汉字识别技术在档案管理工作中的应用[J]. 中国商界(下半月) 2008(09)
    • [9].汉字识别在档案管理中的应用[J]. 广东科技 2008(12)
    • [10].少数民族大学生高频汉字识别字义通达类型研究[J]. 黑龙江教育学院学报 2014(01)
    • [11].汉字识别的正字法加工初探[J]. 白城师范学院学报 2012(04)
    • [12].正字法规则对汉字识别影响初探[J]. 赤峰学院学报(汉文哲学社会科学版) 2009(03)
    • [13].汉字识别的词义通达模型[J]. 河南教育学院学报(自然科学版) 2014(04)
    • [14].汉字识别技术在档案管理工作中的应用分析[J]. 赤子(上中旬) 2015(07)
    • [15].一种分类器级联的手写相似汉字识别方法[J]. 西安电子科技大学学报 2015(05)
    • [16].缺氧环境下汉字识别字义通达类型研究[J]. 上饶师范学院学报 2013(01)
    • [17].低频汉字识别中语音与字形的作用机制研究——基于听障大学生与健听大学生的比较[J]. 现代特殊教育 2017(12)
    • [18].浅析汉字识别技术在档案管理工作中的应用[J]. 黑龙江史志 2014(15)
    • [19].场景影像汉字识别方法研究[J]. 信息技术 2018(08)
    • [20].低-高年级小学生汉字识别中形音义激活的时间进程[J]. 心理科学 2010(03)
    • [21].档案现代化管理妙用汉字识别技术[J]. 兰台世界 2009(17)
    • [22].基于集成注意力层卷积神经网络的汉字识别[J]. 计算机技术与发展 2018(08)
    • [23].让计算机认字的技术[J]. 兰台内外 2008(02)
    • [24].卷积神经网络的多字体汉字识别[J]. 中国图象图形学报 2018(03)
    • [25].汉字识别的反启动效应[J]. 心理与行为研究 2018(04)
    • [26].基于混合核WLS-SVR的古汉字识别(英文)[J]. 中国科学技术大学学报 2015(04)
    • [27].大数据时代的车牌汉字识别[J]. 上海大学学报(自然科学版) 2016(01)
    • [28].汉字识别的研究综述[J]. 吉林省教育学院学报 2011(03)
    • [29].基于SVM的手写体相似汉字识别[J]. 电脑与信息技术 2008(04)
    • [30].统计模式识别在汉字识别中的应用[J]. 内江科技 2008(11)

    标签:;  ;  ;  ;  

    自然场景中汉字识别关键技术研究
    下载Doc文档

    猜你喜欢