基于层次聚类的中医体质分类研究

基于层次聚类的中医体质分类研究

论文摘要

中医体质分类的规范化和标准化已经成为制约中医体质学说进一步发展的关键性问题。聚类分析不需要任何先验知识,用数学的方法研究和处理给定对象的分类,可以得出客观的结论。将聚类分析应用于体质分类研究将大大推进体质研究的标准化进程。目前已存在一些有关体质聚类分析的实验研究,但由于其数据量少、聚类算法不够完善等缺陷并未能提出被广泛认可的聚类结论。本文首先对聚类分析的相关理论进行了系统的研究;针对中医体质聚类中存在的问题,在聚类之前对调研所得的体质数据进行了具体的分析和处理,并针对维度效应在聚类中可能产生的影响对数据进行了从高维到低维的投影操作;接着,本文提出了一种适用于体质数据的相异度度量方法,并分别用两种方法计算得出了相异度矩阵;最后,本文选取两种层次聚类算法,即分裂聚类算法——分裂分析(DIANA)和聚合分析算法——变色龙(Chameleon),并对Chameleon算法进行了改进,实现了体质数据的聚类,并对聚类质量进行了量化评价。通过对DIANA算法(结合两种相异度度量方法)和改进的Chameleon算法这三种途径计算所得的聚类结果的比较和分析,本文得出的体质分类的实验结论,为体质分类的标准化提供了客观有力的实验结论。另一方面,本文认为该结论在很大程度上与北京中医药大学王琦教授提出的体质九分的结论相一致,证实了其理论的正确性。体质可分是中医体质研究的初步阶段,是体病相关、体质可调等中医体质理论的基础。本文基本完成了体质可分阶段的工作,这对于中医体质的研究来说是不够深入的。另外,对于聚类结果的显示,还需要对科学可视化的理论和技术进行学习和研究,这些将是本文后续工作的主要方向。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 体质聚类分析的现状
  • 1.3 本文工作
  • 1.4 论文的组织结构
  • 第二章 聚类分析
  • 2.1 簇的定义
  • 2.2 数学表示
  • 2.3 聚类分析的应用
  • 2.3.1 信息检索应用
  • 2.3.2 数据库应用
  • 2.3.3 数据压缩应用
  • 2.3.4 图像处理应用
  • 2.4 聚类算法的分类
  • 2.4.1 层次聚类算法
  • 2.4.2 分割聚类算法
  • 2.4.3 其他聚类算法
  • 2.4.4 聚类算法小结
  • 2.5 小结
  • 第三章 人体体征数据处理
  • 3.1 体质量表的设计
  • 3.2 体质数据预处理
  • 3.2.1 数据预处理的主要工作
  • 3.2.2 体质数据的预处理
  • 3.3 体质数据维度效应处理
  • 3.3.1 维度效应
  • 3.3.2 体质数据投影
  • 3.4 一种相异度度量的新方法
  • 3.5 小结
  • 第四章 体质聚类
  • 4.1 两种相异度实现DIANA 算法
  • 4.1.1 算法概述
  • 4.1.2 算法实现
  • 4.1.3 两种相异度对应的聚类结果
  • 4.2 Chameleon 算法的改进及实现
  • 4.2.1 算法概述
  • 4.2.2 算法改进
  • 4.2.3 数据抽样
  • 4.2.4 改进算法的实现
  • 4.2.5 改进算法的聚类结果
  • 4.3 聚类结果比较及分析
  • 4.4 小结
  • 第五章 结束语
  • 致谢
  • 参考文献
  • 研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于层次聚类的中医体质分类研究
    下载Doc文档

    猜你喜欢