低质汉字骨架提取研究

低质汉字骨架提取研究

论文摘要

本文关注骨架提取中的一个困难问题:低质汉字骨架的提取。由于低质汉字受到多种降质因素的影响,大部分现有的骨架提取算法并不能提取出符合人类视觉的且满足“好”骨架标准的骨架。本文首先提出了一个新的低质汉字模型:点云模型,用于提取低质汉字的骨架。点云模型能够充分体现现有汉字的底层信息特征,它不仅能将轮廓特征转变为笔画点特征,也为低质汉字和一般汉字的骨架提取建立了一个统一和可行的模型。在点云模型的基础上,本文将低质汉字骨架提取转化为一个两步的优化问题:首先找到与原始汉字拓扑结构吻合的线段集合(本文称为初始骨架),然后连接这些线段,以获得符合人类视觉和保持原始汉字拓扑特性的低质汉字骨架。本文综合特征分析、聚类、优化和随机场理论,提出了一种新的低质汉字骨架提取算法:首先利用点云模型刻画低质汉字;然后采用主成份分析方法对低质汉字点云进行降维,结合主成份分析方法,本文提出了一种增量广义K均值聚类的方法提取初始骨架;最后将初始骨架连接看成一个标记问题,并通过优化方法处理这类问题,本论文采用高层马尔可夫随机模型连接初始骨架,基于此模型,我们可以尽可能的加入汉字骨架和结构的先验信息(如角度差、平移差、端点距离)作为约束,从而使得这个标记问题得到最优解。本文的贡献主要有:首先提出了用点云模型来刻画低质汉字,然后基于此模型提出了一种低质汉字骨架提取的新算法,实验结果表明本文提出的新算法即使在严重降质的情况下也能够获得满足“好”骨架标准的骨架。除此之外,本文为低质汉字的骨架提取建立了全新的模型和理论框架,也为低质汉字骨架提取提供了一种全新的思路,相信能够启发低质汉字骨架提取的新方法和新思路的研究。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题的背景及研究意义
  • 1.2 骨架提取现状
  • 1.3 本文的研究动机和目的
  • 1.4 本文的特色创新
  • 1.5 论文的总体框架
  • 第二章 汉字骨架及其现有提取算法的分析研究
  • 2.1 汉字骨架
  • 2.1.1 汉字骨架的定义
  • 2.1.2 “好”骨架评价标准
  • 2.2 现有骨架提取算法分析研究
  • 2.2.1 早期对称轴分析方法
  • 2.2.2 基于小波极大模的骨架提取算法
  • 2.2.3 基于数学形态学的骨架提取方法
  • 2.2.4 形状分解骨架提取方法
  • 2.4 低质汉字骨架提取难点
  • 2.4.1 轮廓模型
  • 2.4.2 低质汉字与汉字降质因素
  • 2.5 本章小结
  • 第三章 相关数学理论
  • 3.1 主成份分析(PCA)
  • 3.1.1 主成份分析原理
  • 3.1.2 主成份分析在汉字骨架提取中的应用
  • 3.1.3 主成份分析求解步骤
  • 3.2 K 均值聚类
  • 3.3 高层马尔可夫随机场
  • 3.3.1 邻域系统和势能团
  • 3.3.2 高层马尔可夫随机场(HLMRF)与吉布斯随机场(GRF)
  • 3.3.3 贝叶斯理论与 MAP-MRF 框架
  • 3.3.4 MAP-MRF 框架求解
  • 3.4 本章小结
  • 第四章 基于点云模型的低质汉字骨架提取
  • 4.1 点云模型
  • 4.2 提取初始骨架
  • 4.2.1 点云模型与初始骨架
  • 4.2.2 增量广义 K 均值聚类
  • 4.2.3 提取初始骨架算法实现
  • 4.3 连接初始骨架
  • 4.3.1 初始骨架连接与优化问题
  • 4.3.2 基于高层马尔可夫随机场模型的初始骨架连接方法
  • 4.3.3 连接初始骨架算法实现
  • 4.4 基于点云模型的低质汉字骨架提取算法框架
  • 4.5 本章小结
  • 第五章 实验结果及讨论
  • 5.1 算法程序的文件结构
  • 5.2 基于本文算法的实验结果
  • 5.2.1 基于本文方法提取初始骨架中间步骤结果
  • 5.2.2 基于本文方法的实验结果
  • 5.3 现有方法与本文方法的对比实验
  • 5.3.1 现有初始骨架提取方法与本文初始骨架提取方法对比
  • 5.3.2 现有连接骨架方法与本文连接骨架方法对比
  • 5.3.3 现有骨架提取算法与本文方法对比实验
  • 5.4 本章小结
  • 第六章 结语和展望
  • 6.1 结语
  • 6.2 展望
  • 参考文献
  • 致谢
  • 研究生在校期间的科研成果
  • 参与的研究项目
  • 发表的论文
  • 相关论文文献

    • [1].浅谈汉字发展与中国文化[J]. 现代交际 2016(21)
    • [2].小学低年级学生汉字学习认知诊断研究[J]. 教育探究 2019(02)
    • [3].《汉字里的纪律和规矩》[J]. 博览群书 2019(12)
    • [4].书法对汉字字形认知加工的影响——评《汉字认知与书法表现》[J]. 语文建设 2019(23)
    • [5].汉字与中国文化教学中的理据研究[J]. 皖西学院学报 2019(06)
    • [6].多媒体技术在汉字应用课堂教学中的应用研究[J]. 中国多媒体与网络教学学报(中旬刊) 2019(12)
    • [7].论“象”:汉字图象与汉字美学[J]. 江海学刊 2020(01)
    • [8].浅谈汉字的文化功能与文化传播路径——评《汉字审美与文化传播》[J]. 中国教育学刊 2020(02)
    • [9].基于汉字的桥式学习[J]. 语文建设 2019(22)
    • [10].互联网时代下的大学生汉字危机对策研究[J]. 汉字文化 2019(23)
    • [11].汉字演变及发展规律简析[J]. 辽宁广播电视大学学报 2019(04)
    • [12].弘扬汉字文化,为汉字和汉字文化走向世界贡献力量——纪念《汉字文化》创刊30周年[J]. 汉字文化 2020(05)
    • [13].浅析汉字元素在茶包装设计中的多层面运用[J]. 工业设计 2020(03)
    • [14].汉字趣解[J]. 思维与智慧 2020(02)
    • [15].从“灾荒”汉字看古代的救灾防治工作[J]. 汉字文化 2020(04)
    • [16].用科学的汉字理论指导汉字教育[J]. 汉语言文学研究 2020(01)
    • [17].汉字见智慧[J]. 秘书之友 2020(03)
    • [18].汉字趣解[J]. 思维与智慧 2020(06)
    • [19].西方作家对汉字的创造性误用——以谢阁兰和庞德为例[J]. 广东社会科学 2020(03)
    • [20].大学生汉字应用调查研究[J]. 中国大学教学 2020(Z1)
    • [21].基于汉字演变史与对社会影响的弘扬中华汉字文化的教育研究[J]. 产业与科技论坛 2020(06)
    • [22].“思维”在文字里生长[J]. 教育观察 2020(11)
    • [23].青年文化中汉字图案的服饰表达[J]. 戏剧之家 2020(18)
    • [24].饮水思源 计算机汉字标准造福人类——纪念第一个计算机汉字标准诞生40周年[J]. 中国标准化 2020(05)
    • [25].一字汉字ザ变动词上一段化在不同时期的差异[J]. 湖北科技学院学报 2020(02)
    • [26].探究汉字“家”的结构与古文化[J]. 文物鉴定与鉴赏 2020(08)
    • [27].汉字分化的三种内涵析论[J]. 国学学刊 2020(02)
    • [28].汉字型塑“中国”[J]. 书城 2020(07)
    • [29].留学生汉字认知偏误探析[J]. 汉字文化 2020(10)
    • [30].汉字文化热的喜与忧[J]. 智慧中国 2020(08)

    标签:;  ;  ;  ;  

    低质汉字骨架提取研究
    下载Doc文档

    猜你喜欢