改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用

论文摘要

在以前的研究中,更多的数据挖掘的算法应用于Ⅱ型糖尿病中。这个研究的目标是设计和实现一个数据挖掘的算法,帮助医生更好的诊断和分析Ⅰ型糖尿病病人的病情。为了完成这个目标,首先是收集记录Ⅰ型糖尿病人的血糖值。然后是学习了解主流的数据挖掘算法,通过阅读文献比较这些算法。最初选取的是K-means算法应用到Ⅰ型糖尿病中去聚类病人的血糖值。然而,K-means算法有三个主要的缺点。第一,K-means算法的执行结果非常的依赖于数据输入的顺序。第二,K-means算法对孤立点非常敏感,并且会降低聚类的准确率。第三,很难对落在重叠区域的数据样本很好的聚类。因此,使用分层分类的方法解决第一个问题,使输出的结果不依赖于数据属于的顺序。使用分层抽样的方法解决第二个问题,将孤立点从数据集中分离,避免孤立点对聚类结果的影响。提出使用模糊逻辑和K-means算法相结合解决第三个缺点,使得落在重叠区域的数据样本不会丢失转变信息。对于解决每个缺点的方法,都用实验验证了算法的可行性。

论文目录

致谢

中文摘要

ABSTRACT

引言

1 介绍

1.1 动机

1.2 目的与目标

1.3 论文结构

2 文献综述

2.1 数据挖掘算法

2.2 数据挖掘的医学应用

2.3 K-means算法

2.4 模糊集合和模糊逻辑应用在数据挖掘中

2.5 糖尿病病理

3 改进K-means算法

3.1 初始化分类中心

3.1.1 错误聚类

3.1.2 分层分类的方法初始化中心点

3.2 孤立点的鉴定

3.3 改进K-means算法的验证

4 模糊逻辑应用于K-means算法

4.1 模糊K-means算法

4.2 模糊聚类

4.3 模糊的实验结果

5 改进K-means算法在Ⅰ型糖尿病数据聚类中的应用

5.1 数据预处理

5.2 聚类

5.2.1 去除孤立点

5.2.2 初始化分类中心

5.2.3 聚类结果

5.3 模糊聚类

5.4 结果分析

6 结论和今后工作

6.1 结论

6.2 贡献

6.3 今后的工作

参考文献

附录A

索引

作者简历

学位论文数据集

改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用

论文摘要

论文目录

相关论文文献

猜你喜欢