改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用

改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用

论文摘要

在以前的研究中,更多的数据挖掘的算法应用于Ⅱ型糖尿病中。这个研究的目标是设计和实现一个数据挖掘的算法,帮助医生更好的诊断和分析Ⅰ型糖尿病病人的病情。为了完成这个目标,首先是收集记录Ⅰ型糖尿病人的血糖值。然后是学习了解主流的数据挖掘算法,通过阅读文献比较这些算法。最初选取的是K-means算法应用到Ⅰ型糖尿病中去聚类病人的血糖值。然而,K-means算法有三个主要的缺点。第一,K-means算法的执行结果非常的依赖于数据输入的顺序。第二,K-means算法对孤立点非常敏感,并且会降低聚类的准确率。第三,很难对落在重叠区域的数据样本很好的聚类。因此,使用分层分类的方法解决第一个问题,使输出的结果不依赖于数据属于的顺序。使用分层抽样的方法解决第二个问题,将孤立点从数据集中分离,避免孤立点对聚类结果的影响。提出使用模糊逻辑和K-means算法相结合解决第三个缺点,使得落在重叠区域的数据样本不会丢失转变信息。对于解决每个缺点的方法,都用实验验证了算法的可行性。

论文目录

  • 致谢
  • 中文摘要
  • ABSTRACT
  • 引言
  • 1 介绍
  • 1.1 动机
  • 1.2 目的与目标
  • 1.3 论文结构
  • 2 文献综述
  • 2.1 数据挖掘算法
  • 2.2 数据挖掘的医学应用
  • 2.3 K-means算法
  • 2.4 模糊集合和模糊逻辑应用在数据挖掘中
  • 2.5 糖尿病病理
  • 3 改进K-means算法
  • 3.1 初始化分类中心
  • 3.1.1 错误聚类
  • 3.1.2 分层分类的方法初始化中心点
  • 3.2 孤立点的鉴定
  • 3.3 改进K-means算法的验证
  • 4 模糊逻辑应用于K-means算法
  • 4.1 模糊K-means算法
  • 4.2 模糊聚类
  • 4.3 模糊的实验结果
  • 5 改进K-means算法在Ⅰ型糖尿病数据聚类中的应用
  • 5.1 数据预处理
  • 5.2 聚类
  • 5.2.1 去除孤立点
  • 5.2.2 初始化分类中心
  • 5.2.3 聚类结果
  • 5.3 模糊聚类
  • 5.4 结果分析
  • 6 结论和今后工作
  • 6.1 结论
  • 6.2 贡献
  • 6.3 今后的工作
  • 参考文献
  • 附录A
  • 索引
  • 作者简历
  • 学位论文数据集
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用
    下载Doc文档

    猜你喜欢