论文摘要
汉字的模式识别和视觉信息获取,涉及数学、计算机科学、电子信息、人工智能、心理学、语言学和文字学等多个学科。汉字识别研究不仅在语言的基础研究中有着重要的理论意义,而且在计算机汉化操作平台设计、汉字输入法系统开发、汉字光学字符识别技术汉语语言教学与法庭文字证据的笔迹鉴定等众多领域都有直接的应用价值。本研究在汉字单字识别的框架内,以汉字单字为视觉材料,利用眼动仪实时测量被试在注视汉字时的眼动情况,以模板理论、原型理论和特征理论为理论支持,探讨了汉字识别的构形学视觉识别特征和认知加工过程,主要包括完整印刷体汉字识别、残缺印刷体汉字识别和手写体汉字识别三个方面。其中,在完整印刷体汉字识别中,主要探讨了汉字识别的一些基础性问题,如汉字的结构效应、笔画效应和字频效应,以及注视位置偏好和扫描模式等。在残缺印刷体汉字识别中,主要探讨了残缺汉字被识别的程度和可识别性特征,以及成功恢复汉字原形的一致性眼动模式。在手写体汉字识别中,对手写体汉字变形进行了分类模型预设,对手写体汉字识别指标和视觉模式进行了分析。通过对三个实验的综合分析,得出以下结论:第一,汉字的识别绩效与复杂性无关,汉字视觉构形特征不会直接影响我们的识别过程,汉字的熟悉程度和使用程度决定着我们的识别成绩与眼动模式,熟悉性验证是汉字模式识别的前提。第二,小面积的规则残缺不会影响我们对汉字的正确识别,识别率在95%以上。对残缺汉字进行计算机的数字化图像处理,须经过“寻找对称点——连接点成线——偏旁相似性选择——整字相似性选择——汉字确认”五个阶段,逐步增强相似度,降低识别难度,以实现准确识别。第三,人类识别手写体汉字不需要经过图形的预处理,可直接进入汉字特征提取。手写体汉字识别应该增强多线索性、多向激活性,提高后处理阶段的语言情境判断能力。本研究从人类识别汉字的视觉特点出发,来探讨人类是如何搜索、评价和选择汉字相关识别线索和信息的,并试图通过寻找汉字识别的视觉模式和规律,为汉字的机器自动识别提供可借鉴的经验与心理学依据,以提高机器识别的识别率和亲和性。