基于认知机理的汉字智能造字研究

基于认知机理的汉字智能造字研究

论文摘要

文字信息化是信息化的重要内容,现有的中文信息处理主要基于字库方式。基于字库方式的中文信息处理系统,以汉字作为信息处理的基本单元,这种方式基本满足了社会的主要需求,但还存在以下不足:(1)难以形成规模适度又长期稳定的国家标准和国际标准;(2)不符合汉字造字规律和不能很好地传承中华文明;(3)不符合汉字教学认知规律,与现行的汉字教学脱节;(4)不能全面满足社会的应用需求,(5)信息熵高,信息处理效率低。信息化智能化是时代的特征,认知科学是探究人类智能本质的学科,智能科学和认知科学的发展,为解决汉字信息处理存在的问题提供了可能的研究方法和解决途径。本文将智能化技术与认知科学的研究成果相结合,对汉字智能造字的理论和方法做了深入研究。主要研究内容和研究结果如下:(1)在对汉字传统造字理论和汉字认知机理深入分析基础上,把传统造字理论和认知心理学的原型理论结合起来,提出了基于认知机理的汉字智能造字理论,指出汉字智能造字的内容和研究任务。在上述研究基础上,以点集拓扑学为数学工具,建立了汉字智能造字模型,并设计了汉字智能造字的计算机体系架构。(2)深入分析了与汉字原型相关的研究,得出汉字部首和汉字部件是汉字原型主要来源的结论。在此基础上,提出了兼顾传承文化,方便使用和兼顾计算机处理效率的汉字原型提取原则。结合汉字原型提取原则,以独体字和《辞海》中的部首为汉字原型的初次试验集,通过汉字原型拼组实验,采用实验、分析调整、再实验的循环优化流程来研究汉字原型的提取。依照上述流程,以GB18030-2000中的27484个汉字为实验集,进行汉字原型的提取实验,得到覆盖全体实验集的汉字原型阶段性集合一个。实验结果表明本文提出的汉字原型提取流程可行并具有推广性,可推广到其它实验集的汉字原型提取研究。原型提取实验的成功,在一定程度上验证了基于认知机理的汉字智能造字的可行性。(3)在对汉字结构相关研究进行深入分析的基础上,针对现有的汉字结构分类方法的不足,提出了一种以图形层次为基础的汉字结构分类理论。根据上述汉字结构分类理论,以原有13种汉字结构类型为基础,提出18种汉字结构分类方法.以GB2312-80和GB18030-2000为实验集,进行汉字结构分类实验,实验结果表明18种汉字结构分类方法的有效性,完全覆盖实验集。从计算机信息处理的角度出发,建立了用于汉字结构的识别的网格数学模型,并以GB2312-80为实验集,结合本文提出的18种汉字结构分类方法,设计了基于网格数学模型的汉字结构的计算机识别实验,实验结果表明了汉字结构分类的正确性。(4)结合编码理论,深入分析了汉字认知机理和汉字的传统使用习惯,制定了汉字编码的研究目标。在上述研究基础上,提出“汉字结构+汉字原型”的汉字编码方案。方案采用汉字结构分级编码的方法,符合汉字学习者的“先整体后局部、先大后小,从上到下,从左到右,先外后内”的认知结构。按照上述汉字编码方案,以GB18030-2000收录的27484个汉字为实验集,结合计算机辅助实验软件,采用优化调整的实验流程进行汉字编码实验研究。实验结果表明,按本文提出的汉字编码方法进行编码,得到的汉字编码结果集无重码,汉字编码的平均码长少于5,汉字编码包含汉字的所有特征信息,达到预期的目标。(5)根据汉字智能造字实验的需求,分析了汉字智能造字实验平台的系统需求,给出了汉字智能造字实验平台的技术方案,在Linux操作系统上实现了汉字智能造字实验平台。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 认知科学
  • 1.2 汉字信息处理发展及述评
  • 1.2.1 基于字库的汉字信息化
  • 1.2.2 基于造字的汉字信息处理思想萌芽
  • 1.2.3 智能造字思想的产生
  • 1.3 本文的主要思想
  • 1.4 本文的主要研究内容及结构安排
  • 第二章 智能造字理论研究
  • 2.1 引言
  • 2.2 汉字传统造字理论
  • 2.3 汉字认知机理
  • 2.3.1 汉字的认知心理学解释
  • 2.3.2 汉字教学认知机理
  • 2.3.3 汉字认知学习机理
  • 2.4 基于认知机理的智能造字研究
  • 2.5 智能造字数学模型
  • 2.5.1 点集拓扑学知识简介
  • 2.5.2 智能造字数学模型
  • 2.6 智能造字的体系结构
  • 2.6.1 造字知识库
  • 2.6.2 造字处理模块
  • 2.6.3 外部接口
  • 2.7 本章小结
  • 第三章 汉字原型研究
  • 3.1 引言
  • 3.2 与汉字原型相关的研究述评
  • 3.2.1 偏旁部首
  • 3.2.2 汉字部件
  • 3.3 汉字原型的实验研究
  • 3.3.1 汉字原型的提取原则
  • 3.3.2 汉字原型的提取实验方案
  • 3.3.3 实验结果及分析
  • 3.4 本章小结
  • 第四章 汉字结构研究
  • 4.1 引言
  • 4.2 汉字结构相关研究述评
  • 4.3 汉字结构分类研究
  • 4.3.1 汉字结构分类理论
  • 4.4 汉字结构的计算机处理研究
  • 4.4.1 网格数学模型
  • 4.4.2 基于网格的汉字结构分析
  • 4.4.3 基于网格的汉字结构计算机描述研究
  • 4.4.4 实验及结果分析
  • 4.5 本章小结
  • 第五章 智能造字的编码研究
  • 5.1 引言
  • 5.2 编码基本理论
  • 5.2.1 编码任务
  • 5.2.2 编码的性能要求
  • 5.3 汉字编码的认知机理
  • 5.4 汉字编码研究
  • 5.4.1 研究目标
  • 5.4.2 编码规则
  • 5.4.3 汉字编码实验流程
  • 5.4.4 汉字编码实验
  • 5.4.5 实验及其结果分析
  • 5.5 本章小结
  • 第六章 基于LINUX的智能造字实验平台
  • 6.1 引言
  • 6.2 系统方案
  • 6.2.1 功能要求
  • 6.2.2 技术方案
  • 6.2.3 体系架构
  • 6.3 实验平台基本系统方案设计
  • 6.3.1 显示子系统
  • 6.3.2 输入子系统
  • 6.3.3 编码处理子系统
  • 6.3.4 造字子系统
  • 6.4 智能造字实验操作举例
  • 6.5 本章小结
  • 结论
  • 参考文献
  • 附录1 汉字原型
  • 附录2 汉字编码
  • 攻读博士学位期间取得的研究成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于认知机理的汉字智能造字研究
    下载Doc文档

    猜你喜欢