聚类挖掘研究及其在隧道病害评价中的应用

聚类挖掘研究及其在隧道病害评价中的应用

论文摘要

信息社会对海量数据的处理能力提出了更高的要求。数据挖掘技术伴随着这种需求应运而生,已成为信息技术研究的热点之一。而聚类挖掘是数据挖掘技术中被广泛采用的技术之一。本文主要对模糊聚类算法FCM进行了改进:结合竞争聚类算法CA、健壮性算法NC和关系型聚类算法FRC,提出了新的目标函数,并借鉴以上几种算法的推导方法,推导出隶属度的迭代公式。该算法具有以下特点:第一,通过竞争因子,使大量的初始聚类逐渐退化到最佳数目的聚类,可以解决传统算法由于缺乏先验知识而产生的聚类数目不合理的问题;第二,通过引入噪声类项,使得算法对孤立点有良好的适应性,从而更加健壮;第三,在目标函数中直接引入相异度函数,使得算法可以直接适用于非欧几里德距离的关系数据。此外,本文在研究基于划分的聚类算法的基础上,对k-均值算法进行改进,提出PKM算法,通过计算机仿真验证了算法的优越性。结合隧道病害检测数据的特点,本文提出了从预处理到评价的有效方法。首先,对数据进行清洗,采用离散化和归一化方法对数据进行转换,并给出数据的集成方法;随后,针对预处理后的数据,应用病害数据相似(异)度的度量方法求解隧道之间的相异度;最后,采用改进的模糊聚类算法以及病害等级评价方法,对758条隧道的病害检测数据进行聚类分析,得出聚类结果,并将结果按照严重程度划分为四个等级,对应病害的四种健康状况。通过对病害状况的初步分析,本文提出若干意见和建议,为隧道病害整治和防治提供有用参考。

论文目录

  • 致谢
  • 中文摘要
  • ABSTRACT
  • 1 引言
  • 1.1 论文研究的目的和意义
  • 1.2 研究现状
  • 1.2.1 数据挖掘技术及研究现状
  • 1.2.2 聚类技术研究及应用现状
  • 1.2.3 隧道病害评价研究现状
  • 1.3 论文的主要内容及组织结构
  • 2 经典聚类算法及其改进
  • 2.1 聚类问题描述
  • 2.1.1 聚类概念
  • 2.1.2 聚类结果的表达
  • 2.1.3 聚类有效性评价
  • 2.2 数据类型与数据结构
  • 2.2.1 数据类型与相异度度量
  • 2.2.2 数据结构
  • 2.3 聚类技术主要研究问题
  • 2.4 经典聚类算法研究
  • 2.5 改进的聚类算法PKM
  • 2.5.1 PKM算法
  • 2.5.2 实验结果及分析
  • 3 模糊聚类算法及改进
  • 3.1 模糊聚类概述
  • 3.1.1 模糊聚类的概念
  • 3.1.2 模糊聚类一般方法
  • 3.2 模糊 c-均值算法研究
  • 3.2.1 FCM算法
  • 3.2.2 FCM算法健壮性研究
  • 3.3 模糊CA算法研究
  • 3.4 NC健壮性算法研究
  • 3.5 关系型模糊聚类算法研究
  • 3.5.1 关系型FCM算法
  • 3.5.2 FRC算法
  • 3.5.3 关系型CA算法
  • 3.6 改进的CAFRC算法
  • 3.6.1 健壮的关系型竞争算法CAFRC
  • 3.6.2 关系型数据实验
  • 3.6.3 实验结果及评价
  • 4 聚类挖掘在隧道病害评价中的应用
  • 4.1 预处理方法
  • 4.1.1 数据清洗
  • 4.1.2 数据转换
  • 4.1.3 数据集成
  • 4.2 相似度计算研究
  • 4.2.1 数据标准化处理
  • 4.2.2 简单相似度计算
  • 4.2.3 复杂相似度计算
  • 4.3 聚类算法研究
  • 4.3.1 隧道数据的特点
  • 4.3.2 聚类算法改进
  • 4.3.3 聚类结果评价法
  • 4.4 聚类结果及分析
  • 5 结束语
  • 5.1 研究工作总结
  • 5.2 下一步研究展望
  • 参考文献
  • 附录 A
  • 附录 B
  • 附录 C
  • 作者简历
  • 相关论文文献

    标签:;  ;  ;  ;  

    聚类挖掘研究及其在隧道病害评价中的应用
    下载Doc文档

    猜你喜欢