论文摘要
信息社会对海量数据的处理能力提出了更高的要求。数据挖掘技术伴随着这种需求应运而生,已成为信息技术研究的热点之一。而聚类挖掘是数据挖掘技术中被广泛采用的技术之一。本文主要对模糊聚类算法FCM进行了改进:结合竞争聚类算法CA、健壮性算法NC和关系型聚类算法FRC,提出了新的目标函数,并借鉴以上几种算法的推导方法,推导出隶属度的迭代公式。该算法具有以下特点:第一,通过竞争因子,使大量的初始聚类逐渐退化到最佳数目的聚类,可以解决传统算法由于缺乏先验知识而产生的聚类数目不合理的问题;第二,通过引入噪声类项,使得算法对孤立点有良好的适应性,从而更加健壮;第三,在目标函数中直接引入相异度函数,使得算法可以直接适用于非欧几里德距离的关系数据。此外,本文在研究基于划分的聚类算法的基础上,对k-均值算法进行改进,提出PKM算法,通过计算机仿真验证了算法的优越性。结合隧道病害检测数据的特点,本文提出了从预处理到评价的有效方法。首先,对数据进行清洗,采用离散化和归一化方法对数据进行转换,并给出数据的集成方法;随后,针对预处理后的数据,应用病害数据相似(异)度的度量方法求解隧道之间的相异度;最后,采用改进的模糊聚类算法以及病害等级评价方法,对758条隧道的病害检测数据进行聚类分析,得出聚类结果,并将结果按照严重程度划分为四个等级,对应病害的四种健康状况。通过对病害状况的初步分析,本文提出若干意见和建议,为隧道病害整治和防治提供有用参考。
论文目录
致谢中文摘要ABSTRACT1 引言1.1 论文研究的目的和意义1.2 研究现状1.2.1 数据挖掘技术及研究现状1.2.2 聚类技术研究及应用现状1.2.3 隧道病害评价研究现状1.3 论文的主要内容及组织结构2 经典聚类算法及其改进2.1 聚类问题描述2.1.1 聚类概念2.1.2 聚类结果的表达2.1.3 聚类有效性评价2.2 数据类型与数据结构2.2.1 数据类型与相异度度量2.2.2 数据结构2.3 聚类技术主要研究问题2.4 经典聚类算法研究2.5 改进的聚类算法PKM2.5.1 PKM算法2.5.2 实验结果及分析3 模糊聚类算法及改进3.1 模糊聚类概述3.1.1 模糊聚类的概念3.1.2 模糊聚类一般方法3.2 模糊 c-均值算法研究3.2.1 FCM算法3.2.2 FCM算法健壮性研究3.3 模糊CA算法研究3.4 NC健壮性算法研究3.5 关系型模糊聚类算法研究3.5.1 关系型FCM算法3.5.2 FRC算法3.5.3 关系型CA算法3.6 改进的CAFRC算法3.6.1 健壮的关系型竞争算法CAFRC3.6.2 关系型数据实验3.6.3 实验结果及评价4 聚类挖掘在隧道病害评价中的应用4.1 预处理方法4.1.1 数据清洗4.1.2 数据转换4.1.3 数据集成4.2 相似度计算研究4.2.1 数据标准化处理4.2.2 简单相似度计算4.2.3 复杂相似度计算4.3 聚类算法研究4.3.1 隧道数据的特点4.3.2 聚类算法改进4.3.3 聚类结果评价法4.4 聚类结果及分析5 结束语5.1 研究工作总结5.2 下一步研究展望参考文献附录 A附录 B附录 C作者简历
相关论文文献
标签:数据挖掘论文; 聚类论文; 模糊聚类论文; 隧道病害论文;