基于认知机理的汉字智能造字研究

论文摘要

文字信息化是信息化的重要内容,现有的中文信息处理主要基于字库方式。基于字库方式的中文信息处理系统,以汉字作为信息处理的基本单元,这种方式基本满足了社会的主要需求,但还存在以下不足:（1）难以形成规模适度又长期稳定的国家标准和国际标准;（2）不符合汉字造字规律和不能很好地传承中华文明;（3）不符合汉字教学认知规律,与现行的汉字教学脱节;（4）不能全面满足社会的应用需求,（5）信息熵高,信息处理效率低。信息化智能化是时代的特征,认知科学是探究人类智能本质的学科,智能科学和认知科学的发展,为解决汉字信息处理存在的问题提供了可能的研究方法和解决途径。本文将智能化技术与认知科学的研究成果相结合,对汉字智能造字的理论和方法做了深入研究。主要研究内容和研究结果如下:（1）在对汉字传统造字理论和汉字认知机理深入分析基础上,把传统造字理论和认知心理学的原型理论结合起来,提出了基于认知机理的汉字智能造字理论,指出汉字智能造字的内容和研究任务。在上述研究基础上,以点集拓扑学为数学工具,建立了汉字智能造字模型,并设计了汉字智能造字的计算机体系架构。（2）深入分析了与汉字原型相关的研究,得出汉字部首和汉字部件是汉字原型主要来源的结论。在此基础上,提出了兼顾传承文化,方便使用和兼顾计算机处理效率的汉字原型提取原则。结合汉字原型提取原则,以独体字和《辞海》中的部首为汉字原型的初次试验集,通过汉字原型拼组实验,采用实验、分析调整、再实验的循环优化流程来研究汉字原型的提取。依照上述流程,以GB18030-2000中的27484个汉字为实验集,进行汉字原型的提取实验,得到覆盖全体实验集的汉字原型阶段性集合一个。实验结果表明本文提出的汉字原型提取流程可行并具有推广性,可推广到其它实验集的汉字原型提取研究。原型提取实验的成功,在一定程度上验证了基于认知机理的汉字智能造字的可行性。（3）在对汉字结构相关研究进行深入分析的基础上,针对现有的汉字结构分类方法的不足,提出了一种以图形层次为基础的汉字结构分类理论。根据上述汉字结构分类理论,以原有13种汉字结构类型为基础,提出18种汉字结构分类方法.以GB2312-80和GB18030-2000为实验集,进行汉字结构分类实验,实验结果表明18种汉字结构分类方法的有效性,完全覆盖实验集。从计算机信息处理的角度出发,建立了用于汉字结构的识别的网格数学模型,并以GB2312-80为实验集,结合本文提出的18种汉字结构分类方法,设计了基于网格数学模型的汉字结构的计算机识别实验,实验结果表明了汉字结构分类的正确性。（4）结合编码理论,深入分析了汉字认知机理和汉字的传统使用习惯,制定了汉字编码的研究目标。在上述研究基础上,提出“汉字结构+汉字原型”的汉字编码方案。方案采用汉字结构分级编码的方法,符合汉字学习者的“先整体后局部、先大后小,从上到下,从左到右,先外后内”的认知结构。按照上述汉字编码方案,以GB18030-2000收录的27484个汉字为实验集,结合计算机辅助实验软件,采用优化调整的实验流程进行汉字编码实验研究。实验结果表明,按本文提出的汉字编码方法进行编码,得到的汉字编码结果集无重码,汉字编码的平均码长少于5,汉字编码包含汉字的所有特征信息,达到预期的目标。（5）根据汉字智能造字实验的需求,分析了汉字智能造字实验平台的系统需求,给出了汉字智能造字实验平台的技术方案,在Linux操作系统上实现了汉字智能造字实验平台。

论文目录

摘要

Abstract

第一章绪论

1.1 认知科学

1.2 汉字信息处理发展及述评

1.2.1 基于字库的汉字信息化

1.2.2 基于造字的汉字信息处理思想萌芽

1.2.3 智能造字思想的产生

1.3 本文的主要思想

1.4 本文的主要研究内容及结构安排

第二章智能造字理论研究

2.1 引言

2.2 汉字传统造字理论

2.3 汉字认知机理

2.3.1 汉字的认知心理学解释

2.3.2 汉字教学认知机理

2.3.3 汉字认知学习机理

2.4 基于认知机理的智能造字研究

2.5 智能造字数学模型

2.5.1 点集拓扑学知识简介

2.5.2 智能造字数学模型

2.6 智能造字的体系结构

2.6.1 造字知识库

2.6.2 造字处理模块

2.6.3 外部接口

2.7 本章小结

第三章汉字原型研究

3.1 引言

3.2 与汉字原型相关的研究述评

3.2.1 偏旁部首

3.2.2 汉字部件

3.3 汉字原型的实验研究

3.3.1 汉字原型的提取原则

3.3.2 汉字原型的提取实验方案

3.3.3 实验结果及分析

3.4 本章小结

第四章汉字结构研究

4.1 引言

4.2 汉字结构相关研究述评

4.3 汉字结构分类研究

4.3.1 汉字结构分类理论

4.4 汉字结构的计算机处理研究

4.4.1 网格数学模型

4.4.2 基于网格的汉字结构分析

4.4.3 基于网格的汉字结构计算机描述研究

4.4.4 实验及结果分析

4.5 本章小结

第五章智能造字的编码研究

5.1 引言

5.2 编码基本理论

5.2.1 编码任务

5.2.2 编码的性能要求

5.3 汉字编码的认知机理

5.4 汉字编码研究

5.4.1 研究目标

5.4.2 编码规则

5.4.3 汉字编码实验流程

5.4.4 汉字编码实验

5.4.5 实验及其结果分析

5.5 本章小结

第六章基于LINUX的智能造字实验平台

6.1 引言

6.2 系统方案

6.2.1 功能要求

6.2.2 技术方案

6.2.3 体系架构

6.3 实验平台基本系统方案设计

6.3.1 显示子系统

6.3.2 输入子系统

6.3.3 编码处理子系统

6.3.4 造字子系统

6.4 智能造字实验操作举例

6.5 本章小结

结论

参考文献

附录1 汉字原型

附录2 汉字编码

攻读博士学位期间取得的研究成果

致谢

基于认知机理的汉字智能造字研究

论文摘要

论文目录

相关论文文献

猜你喜欢