论文摘要
模糊聚类分析法是应用模糊数学的观点和理论,通过建立模糊相似关系而后将客观事物予以分类的一种数学方法。本文从模糊数学的视角出发,认为语言中词语的同义关系正是一种模糊相似关系,可以以此为前提对彼此间构成同义关系的词语进行模糊聚类分析。本文选择同义形容词作为研究对象。由于语言中的文字信息不同于自然学科中的数据信息,所以在对同义形容词进行模糊聚类分析时,需要想办法将语言信息数量化。本文将相似性科学中关于系统要素数量的相似度计算方法引入到同义词的相似性研究中,以现代语义学提出的义素分析法作为量化语言信息的桥梁,通过对某一同义聚合体中的各个形容词两两之间的相似关系进行测试,可以用数值的形式精确地表示出该同义聚合体中任意两个同义形容词之间的相似程度,也就是模糊聚类分析所必需的相似系数。这些相似系数是构成模糊相似矩阵的元素,因为模糊相似矩阵不一定具有传递性,所以需要利用平方自合成法将其改造成模糊等价矩阵,然后以此模糊等价矩阵作为基础,选取适当的置信水平值即可进行动态的聚类分析。本文分三部分进行论述:首先对模糊理论的基本思想作了简要介绍,指出它为研究模糊对象提供了有力的数学手段;其次重点论述了词语同义关系的模糊性以及模糊聚类分析法在同义词研究中的具体应用;最后选取《同义词词林》中的四类10组同义形容词进行了模糊聚类分析。通过聚类的结果可以发现,处于同一个同义聚合体中的各个形容词,它们相互之间的聚合并不在同一平面上,而是可以分为不同层次的小类。模糊聚类分析不仅揭示出了这种小类的存在,而且确定出不同词语归为一类的聚合水平值,使我们对词语的同义现象有了更深入的认识。