语句级联机手写汉字识别方法

语句级联机手写汉字识别方法

论文摘要

联机的手写汉字输入技术已经非常成熟。而起着关键作用的联机识别算法还不能达到高准确率的水平。这主要原因是手写汉字类别多、字形的多样化、各种形近字、连笔输入等原因。所以怎样解决这些差异、选出最具分类能力的特征与分类器成为识别技术的关键。虽然各种成熟高识别率的书写识别产品不断更新问世,但都是限制在一个输入区域且每次只能识别一个汉字,但实际上是有上下文语义的句子或段落。单字输入时,就往往由于要从多个候选字中选择正确的目标汉字,而打断原来写文章的思路。平板电脑、大屏幕触摸设备提供了可以像传统纸张输入方式一样的可能性,一次可以输入多个汉字甚至一条语句。如此,“语句级”甚至“篇章级”汉字识别就成为汉字识别应用的一种新的趋势。联机手写汉字识别技术也会更加注重语句以及篇章级的识别方向。本文将根据语句级识别算法实现一个语句级的联机手写识别系统。用户可以在无约束的条件下手写输入,识别过程在后台进行。当用户完成一句或一个段落时,可以一次性的将整段文字进行识别并显示出来,并可以与手写文档一同保存起来。整个过程分为单字识别阶段与后处理语言模型阶段。单字识别的正确率是重要的因素,特别是对特征的提取。本文对连续的NCFE八方向特征提取算法进行改进,增加了向量的端点处理,根据不同情况运用不同的赋值方法,增强了特征的区分性能,同时将AP聚类算法引入识别的粗分类阶段,AP聚类算法与其他聚类算法相比对手写字符识别有着明显的优势。第二阶段充分利用了用户输入的语义信息,建立语言模型对整个段落进行基于语句级的候选识别结果调整。在这里词典的容量和领域对调整结果影响很大,单纯的依赖字典的调整结果有时不但没有提高识别率,反而影响到正确的识别结果。为了解决这个问题,本文建立了将单字识别结果与语言模型通过优化权重相结合的识别算法。最后,本文的算法在HIT-OR3C以及中科院CASIA-OLHWDB1手写数据集上进行实验与测试。结果表明与其他方法相比较,准确率有了明显的提高。整个语句级识别系统与现有识别系统来说,更是有着使用上的便利性。识别准确率能够满足使用要求。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题来源
  • 1.2 研究目的及意义
  • 1.3 国内外相关技术发展现状
  • 1.3.1 字符识别技术的发展和分类
  • 1.3.2 联机汉字识别技术的发展
  • 1.3.3 语句级汉字后处理技术的发展
  • 1.4 研究内容
  • 第2章 联机手写汉字识别相关技术
  • 2.1 引言
  • 2.2 预处理
  • 2.3 特征提取
  • 2.4 手写识别分类器
  • 2.5 手写汉字后处理技术
  • 第3章 语句级联机手写汉字识别算法
  • 3.1 基于改进NCFE特征的单字联机汉字识别
  • 3.1.1 联机字符预处理
  • 3.1.2 改进NCFE特征提取方法
  • 3.1.3 基于AP聚类的粗分类方法
  • 3.2 联机汉字识别后处理算法
  • 3.2.1 文法数据库
  • 3.2.2 语言模型
  • 3.3 本章小结
  • 第4章 语句级联机手写汉字识别系统实现
  • 4.1 引言
  • 4.2 智能手写编辑系统结构
  • 4.3 手写识别系统的结构与实现
  • 4.4 本章小结
  • 第5章 语句级联机手写汉字识别实验
  • 5.1 联机手写汉字数据库介绍
  • 5.2 单字识别实验结果
  • 5.3 语言模型实验结果
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].特征分组提取融合深度网络手写汉字识别[J]. 计算机工程与应用 2020(12)
    • [2].计算机汉字识别和静态手写汉字签名鉴定技术综述[J]. 网络安全技术与应用 2019(10)
    • [3].手写汉字识别的发展应用综述[J]. 电视指南 2017(24)
    • [4].手写汉字已成为需要保护的传统文化[J]. 基础教育课程 2016(02)
    • [5].最需要继承保护的是手写汉字[J]. 中国钢笔书法 2015(10)
    • [6].基于压缩感知的手写汉字识别研究[J]. 西安航空学院学报 2017(05)
    • [7].手写汉字的特性与生命力[J]. 中国教师 2008(04)
    • [8].基于反向传播算法在联机手写汉字结构识别中的应用[J]. 软件导刊 2011(04)
    • [9].基于笔顺自由及连笔的联机手写汉字识别[J]. 计算机系统应用 2009(05)
    • [10].深度学习在手写汉字识别中的应用综述[J]. 自动化学报 2016(08)
    • [11].手写汉字规定格式练习系统设计[J]. 教师 2009(16)
    • [12].一种改进的脱机手写汉字四角特征粗分类方法[J]. 信息安全与技术 2013(04)
    • [13].基于联机手写汉字字块特征码提取的研究[J]. 电脑知识与技术 2011(01)
    • [14].基于结构聚类和笔画分析的粘连手写汉字切分[J]. 计算机工程与应用 2008(34)
    • [15].基于卷积神经网络的手写汉字识别研究[J]. 信息技术与信息化 2018(12)
    • [16].基于深度学习的异噪声下手写汉字识别的研究[J]. 计算机应用研究 2019(12)
    • [17].基于压缩感知的阅卷系统手写汉字识别算法[J]. 电子科技 2018(03)
    • [18].用于手写汉字识别的文本分割方法[J]. 智能计算机与应用 2018(02)
    • [19].空中手写汉字交互输入与识别实验平台构建[J]. 实验技术与管理 2016(07)
    • [20].用于相似字识别的手写汉字特征优化方法[J]. 哈尔滨工程大学学报 2012(07)
    • [21].基于信息熵的静态手写汉字签名鉴定研究[J]. 计算机应用与软件 2013(01)
    • [22].基于自产生投票的手写汉字识别[J]. 自动化学报 2013(04)
    • [23].一种静态手写汉字签名特征描述算法的实现[J]. 软件导刊 2012(09)
    • [24].“书法速成”:一个浮躁时代的商业噱头[J]. 美术观察 2010(07)
    • [25].概率神经网络在手写汉字识别中的应用[J]. 电子设计工程 2016(02)
    • [26].基于局部模块组合的手写汉字识别算法[J]. 微计算机信息 2011(02)
    • [27].基于相似度的手写汉字笔划鉴别方法实验研究[J]. 实验室研究与探索 2015(12)
    • [28].一种新的手写汉字生成方法[J]. 太原大学学报 2014(03)
    • [29].一种多模型超图用于手写汉字识别算法[J]. 计算机应用与软件 2019(07)
    • [30].联机手写汉字识别系统应用研究[J]. 信息与电脑(理论版) 2018(18)

    标签:;  ;  ;  ;  ;  

    语句级联机手写汉字识别方法
    下载Doc文档

    猜你喜欢