论文摘要
在以前的研究中,更多的数据挖掘的算法应用于Ⅱ型糖尿病中。这个研究的目标是设计和实现一个数据挖掘的算法,帮助医生更好的诊断和分析Ⅰ型糖尿病病人的病情。为了完成这个目标,首先是收集记录Ⅰ型糖尿病人的血糖值。然后是学习了解主流的数据挖掘算法,通过阅读文献比较这些算法。最初选取的是K-means算法应用到Ⅰ型糖尿病中去聚类病人的血糖值。然而,K-means算法有三个主要的缺点。第一,K-means算法的执行结果非常的依赖于数据输入的顺序。第二,K-means算法对孤立点非常敏感,并且会降低聚类的准确率。第三,很难对落在重叠区域的数据样本很好的聚类。因此,使用分层分类的方法解决第一个问题,使输出的结果不依赖于数据属于的顺序。使用分层抽样的方法解决第二个问题,将孤立点从数据集中分离,避免孤立点对聚类结果的影响。提出使用模糊逻辑和K-means算法相结合解决第三个缺点,使得落在重叠区域的数据样本不会丢失转变信息。对于解决每个缺点的方法,都用实验验证了算法的可行性。
论文目录
致谢中文摘要ABSTRACT引言1 介绍1.1 动机1.2 目的与目标1.3 论文结构2 文献综述2.1 数据挖掘算法2.2 数据挖掘的医学应用2.3 K-means算法2.4 模糊集合和模糊逻辑应用在数据挖掘中2.5 糖尿病病理3 改进K-means算法3.1 初始化分类中心3.1.1 错误聚类3.1.2 分层分类的方法初始化中心点3.2 孤立点的鉴定3.3 改进K-means算法的验证4 模糊逻辑应用于K-means算法4.1 模糊K-means算法4.2 模糊聚类4.3 模糊的实验结果5 改进K-means算法在Ⅰ型糖尿病数据聚类中的应用5.1 数据预处理5.2 聚类5.2.1 去除孤立点5.2.2 初始化分类中心5.2.3 聚类结果5.3 模糊聚类5.4 结果分析6 结论和今后工作6.1 结论6.2 贡献6.3 今后的工作参考文献附录A索引作者简历学位论文数据集
相关论文文献
标签:数据挖掘论文; 算法论文; 孤立点论文; 模糊逻辑论文; 糖尿病论文; 血糖值论文; 中心论文; 聚类论文;
改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用
下载Doc文档