数据挖掘中模糊聚类算法研究

数据挖掘中模糊聚类算法研究

论文摘要

数据挖掘不同于传统的数据处理技术,它能够从大量的信息和数据中分析和提取出有用的知识,来帮助人们做出决策。数据挖掘是目前信息领域和数据库技术的前沿研究课题,被公认为是最具发展前景的关键技术之一。作为数据挖掘主要方法之一的聚类分析技术,也随着数据挖掘技术的研究和发展,越来越受到人们的关注。聚类分析是将数据合理归类的一种方法,目前,已提出的聚类分析算法很多,本文对其中最常用的基于目标函数的模糊C-均值聚类分析算法进行了深入研究,针对其算法存在的不足,进行了一些新的改进。首先,针对模糊C-均值聚类分析算法中将数据集隶属度概率和为1的条件用于模糊性事件时,影响聚类正确率的情况,采用可能性理论作为理论基础,提出了一种新的基于隶属关系不确定的可能性改进模糊聚类算法,该算法将可能隶属度与不确定性隶属度引入到目标函数中,使得样本中的元素不局限于仅属于一个聚类,更符合现实情况。其次,针对模糊C-均值聚类分析算法中采用欧式距离进行相异性度量,只能对椭球状分布的数据进行聚类的局限性,采用马式距离进行相异性度量,同时采用输入数据矩阵化,从而能处理更多的数据模式,扩大了聚类的适用范围。为验证本论文提出的方法的有效性,对其进行了实验。从实验结果来看,达到了预期的效果。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 论文研究的背景及目的
  • 1.2 国内外研究现状及成果
  • 1.3 论文主要研究内容和组织结构
  • 第2章 数据挖掘技术研究
  • 2.1 数据挖掘的基本理论
  • 2.1.1 数据挖掘的定义和功能
  • 2.1.2 数据挖掘的基本过程
  • 2.1.3 数据挖掘的分类
  • 2.1.4 数据挖掘所能发现的知识
  • 2.2 数据挖掘算法
  • 2.2.1 关联分析算法
  • 2.2.2 数据分类算法
  • 2.2.3 序列分析算法
  • 2.2.4 聚类分析算法
  • 2.3 本章小结
  • 第3章 聚类分析技术研究
  • 3.1 聚类分析概述
  • 3.1.1 基本概念
  • 3.1.2 相异性度量
  • 3.2 聚类分析算法
  • 3.2.1 聚类算法性能的衡量指标
  • 3.2.2 基于划分的聚类算法
  • 3.2.3 基于层次的聚类算法
  • 3.2.4 基于密度的聚类算法
  • 3.2.5 基于网格的聚类算法
  • 3.2.6 基于模型的聚类算法
  • 3.3 本章小结
  • 第4章 模糊聚类算法的改进
  • 4.1 模糊聚类分析方法
  • 4.1.1 模糊数学和模糊集基本知识
  • 4.1.2 模糊C均值聚类算法FCM
  • 4.2 模糊C均值聚类算法的改进
  • 4.2.1 FCM算法改进的研究方向
  • 4.2.2 改进FCM算法的提出
  • 4.2.3 实验结果分析
  • 4.3 本章小结
  • 第5章 改进模糊聚类算法在入侵检测中的应用
  • 5.1 基于数据挖掘的入侵检测技术
  • 5.1.1 入侵检测系统原理及分类
  • 5.1.2 常用的异常入侵检测技术
  • 5.1.3 基于数据挖掘的入侵检测系统的优势
  • 5.2 基于聚类分析的入侵检测过程
  • 5.2.1 数据源分析
  • 5.2.2 数据的预处理
  • 5.2.3 数据的初始化聚类
  • 5.2.4 实验结果分析
  • 5.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表论文和取得的科研成果
  • 致谢
  • 个人简历
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    数据挖掘中模糊聚类算法研究
    下载Doc文档

    猜你喜欢