论文摘要
中医体质分类的规范化和标准化已经成为制约中医体质学说进一步发展的关键性问题。聚类分析不需要任何先验知识,用数学的方法研究和处理给定对象的分类,可以得出客观的结论。将聚类分析应用于体质分类研究将大大推进体质研究的标准化进程。目前已存在一些有关体质聚类分析的实验研究,但由于其数据量少、聚类算法不够完善等缺陷并未能提出被广泛认可的聚类结论。本文首先对聚类分析的相关理论进行了系统的研究;针对中医体质聚类中存在的问题,在聚类之前对调研所得的体质数据进行了具体的分析和处理,并针对维度效应在聚类中可能产生的影响对数据进行了从高维到低维的投影操作;接着,本文提出了一种适用于体质数据的相异度度量方法,并分别用两种方法计算得出了相异度矩阵;最后,本文选取两种层次聚类算法,即分裂聚类算法——分裂分析(DIANA)和聚合分析算法——变色龙(Chameleon),并对Chameleon算法进行了改进,实现了体质数据的聚类,并对聚类质量进行了量化评价。通过对DIANA算法(结合两种相异度度量方法)和改进的Chameleon算法这三种途径计算所得的聚类结果的比较和分析,本文得出的体质分类的实验结论,为体质分类的标准化提供了客观有力的实验结论。另一方面,本文认为该结论在很大程度上与北京中医药大学王琦教授提出的体质九分的结论相一致,证实了其理论的正确性。体质可分是中医体质研究的初步阶段,是体病相关、体质可调等中医体质理论的基础。本文基本完成了体质可分阶段的工作,这对于中医体质的研究来说是不够深入的。另外,对于聚类结果的显示,还需要对科学可视化的理论和技术进行学习和研究,这些将是本文后续工作的主要方向。