基于能量弹性网格的手写文档检索方法

基于能量弹性网格的手写文档检索方法

论文摘要

如今对于标准编码文字的检索已非常成熟,其应用几乎无处不在。如果能用与检索标准编码文字相类似的方法来实现对以计算机文件形式存储的手写文档的查询和检索的话,则能够大大提高手写体文档的应用价值,从而也为提高人们日常工作效率以及达到真正无纸化办公提供了一种有用的工具。但这并非易事,因为传统的信息检索方法能比较容易地实现对于精确一致信息的检索,但要在手写输入时写出两个完全相同的文字既不现实也无实际意义。本文以一种手写文档处理系统为基础建立手写体文档,并对手写体文档中的文字检索方法进行了研究。手写体文档的检索方法既与手写体文字的识别有相似之处,但同时也有重要区别,主要体现在这种检索需要在开放的集合上执行,而文字识别通常可以看成是在一个事先建立的固定样本集合中查找与匹配,显然前者面临的情况会更复杂。为了有效解决这一问题,本文充分利用时间与空间信息,首先建立了基于模糊语法模式的笔画识别方法,在此基础上,建立了手写体文字的能量弹性网格及基于弹性网格坐标的文字表示,然后利用惩罚因子提高检索信息的冗余度,从而建立了一种计算手写文字匹配的新方法。本文的方法不需要训练数据作为先验知识,对不同人书写的文字具有较高的容错能力。初步实验的结果证明了该方法的有效性。与现有的手写输入检索方法相比,本文所提出的方法检索速度优势明显,对笔画的随意性容忍程度高,正确率和召回率较高,基本满足实用需求。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题来源
  • 1.2 本课题研究的目的及意义
  • 1.3 国内外相关技术发展历史及现状
  • 1.3.1 信息检索技术
  • 1.3.2 汉字识别技术
  • 1.3.3 手写文字检索技术
  • 1.4 本文主要研究内容
  • 第2章 手写文字检索的相关技术
  • 2.1 引言
  • 2.2 图像检索技术
  • 2.2.1 基于文本的图像检索
  • 2.2.2 基于内容的图像检索
  • 2.2.3 基于语义的图像检索
  • 2.3 手写体汉字识别
  • 2.3.1 规范化
  • 2.3.2 特征提取
  • 2.3.3 分类识别
  • 2.4 信息检索的统计模型
  • 2.4.1 基于统计的信息检索模型
  • 2.5 信息检索系统的评价方法
  • 2.6 语法模式识别法
  • 2.7 本章小结
  • 第3章 预处理、建立能量弹性网格及手写文字笔画识别
  • 3.1 引言
  • 3.2 手写文字预处理
  • 3.2.1 手写文字的数据基础
  • 3.2.2 文字的填充
  • 3.3 建立能量弹性网格
  • 3.3.1 弹性网格
  • 3.3.2 能量的确定及再分配
  • 3.3.3 能量弹性网格
  • 3.4 提取基本笔画
  • 3.4.1 提取策略
  • 3.4.2 二维空间坐标方位的划分
  • 3.4.3 模糊语法模式识别方法
  • 3.5 本章小结
  • 第4章 基于能量弹性网格的手写文字检索
  • 4.1 引言
  • 4.2 均匀映射方法确定基本笔画的网格坐标
  • 4.2.1 基本笔画的绝对坐标
  • 4.2.2 基本笔画的网格坐标
  • 4.3 文字匹配的综合加权评分方法
  • 4.3.1 计算原始得分
  • 4.3.2 构造基本笔画匹配序列.
  • 4.3.3 计算惩罚因子
  • 4.3.4 计算最终得分
  • 4.4 本章小结
  • 第5章 系统实现与评测
  • 5.1 引言
  • 5.2 系统实现
  • 5.2.1 全系统的整体架构
  • 5.2.2 提取基本笔画子系统的架构
  • 5.2.3 系统流程图
  • 5.3 系统评测
  • 5.3.1 测试环境
  • 5.3.2 功能测试
  • 5.3.3 性能测试
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].基于公式描述结构和词嵌入的科技文档检索方法[J]. 数据分析与知识发现 2020(01)
    • [2].基于潜在语义分析的文档检索设计方法[J]. 北京石油化工学院学报 2015(02)
    • [3].基于数学表达式特征的科技文档检索模型[J]. 河北大学学报(自然科学版) 2017(06)
    • [4].多类型文档检索和转换技术研究[J]. 微型机与应用 2014(10)
    • [5].基于核化局部敏感哈希的快速文档检索方法[J]. 湖南科技大学学报(自然科学版) 2019(03)
    • [6].数据起源在多版本文档检索中的应用[J]. 上海大学学报(自然科学版) 2018(05)
    • [7].基于地质技术方法非结构化数据的文档检索研究[J]. 中国西部科技 2015(11)
    • [8].汉语语音文档检索中后验概率的索引方法[J]. 哈尔滨工业大学学报 2009(08)
    • [9].文档检索中文本片段化机制的研究[J]. 计算机科学与探索 2020(04)
    • [10].基于本体的TBT文档检索系统研究[J]. 情报杂志 2009(10)
    • [11].基于语义向量空间模型的文档检索系统研究[J]. 情报杂志 2010(05)
    • [12].混合语义模型的产品知识文档检索[J]. 重庆大学学报 2008(10)
    • [13].基于查询意图识别与主题建模的文档检索算法[J]. 计算机工程 2018(03)
    • [14].基于特定位置后验概率网格的开集语音文档检索[J]. 燕山大学学报 2013(04)
    • [15].语义桌面环境下一种基于概念图的文档检索方法[J]. 计算机工程与科学 2009(08)
    • [16].查询扩展在开放领域问答系统中的应用[J]. 计算机应用与软件 2009(07)
    • [17].VB程序设计在对Word文档检索中的应用[J]. 西部探矿工程 2009(12)
    • [18].利用领域本体优化文档检索的研究——基于KIM平台的设计与实现[J]. 现代图书情报技术 2013(12)
    • [19].模糊粗糙集在科技文档检索中的应用研究[J]. 计算机仿真 2011(10)
    • [20].模糊算法在HTML文档检索中的应用[J]. 佛山科学技术学院学报(自然科学版) 2010(03)
    • [21].关于信息技术在办公自动化中的应用[J]. 智慧健康 2016(07)
    • [22].开放域问答技术研究进展[J]. 电子学报 2009(05)
    • [23].基于XML的结构化科技文档检索的研究[J]. 信息系统工程 2012(08)
    • [24].适应文档检索的半监督多样本排序学习算法[J]. 计算机应用 2011(11)
    • [25].语义检索研究综述[J]. 图书情报工作 2008(06)
    • [26].基于自动查询扩展的专利文档检索方法[J]. 中国科技论文 2013(10)
    • [27].混淆网络在音频文档检索系统中的应用研究[J]. 计算机工程与应用 2010(28)
    • [28].基于标签技术和群体绩效评价的多媒体检索[J]. 情报杂志 2011(09)
    • [29].语义检索在广播电视中的应用[J]. 电子技术与软件工程 2015(05)
    • [30].XML文档聚类中基于语义的特征词权重计算方法[J]. 长沙理工大学学报(自然科学版) 2015(02)

    标签:;  ;  ;  

    基于能量弹性网格的手写文档检索方法
    下载Doc文档

    猜你喜欢