论文摘要
数据挖掘不同于传统的数据处理技术,它能够从大量的信息和数据中分析和提取出有用的知识,来帮助人们做出决策。数据挖掘是目前信息领域和数据库技术的前沿研究课题,被公认为是最具发展前景的关键技术之一。作为数据挖掘主要方法之一的聚类分析技术,也随着数据挖掘技术的研究和发展,越来越受到人们的关注。聚类分析是将数据合理归类的一种方法,目前,已提出的聚类分析算法很多,本文对其中最常用的基于目标函数的模糊C-均值聚类分析算法进行了深入研究,针对其算法存在的不足,进行了一些新的改进。首先,针对模糊C-均值聚类分析算法中将数据集隶属度概率和为1的条件用于模糊性事件时,影响聚类正确率的情况,采用可能性理论作为理论基础,提出了一种新的基于隶属关系不确定的可能性改进模糊聚类算法,该算法将可能隶属度与不确定性隶属度引入到目标函数中,使得样本中的元素不局限于仅属于一个聚类,更符合现实情况。其次,针对模糊C-均值聚类分析算法中采用欧式距离进行相异性度量,只能对椭球状分布的数据进行聚类的局限性,采用马式距离进行相异性度量,同时采用输入数据矩阵化,从而能处理更多的数据模式,扩大了聚类的适用范围。为验证本论文提出的方法的有效性,对其进行了实验。从实验结果来看,达到了预期的效果。
论文目录
摘要ABSTRACT第1章 绪论1.1 论文研究的背景及目的1.2 国内外研究现状及成果1.3 论文主要研究内容和组织结构第2章 数据挖掘技术研究2.1 数据挖掘的基本理论2.1.1 数据挖掘的定义和功能2.1.2 数据挖掘的基本过程2.1.3 数据挖掘的分类2.1.4 数据挖掘所能发现的知识2.2 数据挖掘算法2.2.1 关联分析算法2.2.2 数据分类算法2.2.3 序列分析算法2.2.4 聚类分析算法2.3 本章小结第3章 聚类分析技术研究3.1 聚类分析概述3.1.1 基本概念3.1.2 相异性度量3.2 聚类分析算法3.2.1 聚类算法性能的衡量指标3.2.2 基于划分的聚类算法3.2.3 基于层次的聚类算法3.2.4 基于密度的聚类算法3.2.5 基于网格的聚类算法3.2.6 基于模型的聚类算法3.3 本章小结第4章 模糊聚类算法的改进4.1 模糊聚类分析方法4.1.1 模糊数学和模糊集基本知识4.1.2 模糊C均值聚类算法FCM4.2 模糊C均值聚类算法的改进4.2.1 FCM算法改进的研究方向4.2.2 改进FCM算法的提出4.2.3 实验结果分析4.3 本章小结第5章 改进模糊聚类算法在入侵检测中的应用5.1 基于数据挖掘的入侵检测技术5.1.1 入侵检测系统原理及分类5.1.2 常用的异常入侵检测技术5.1.3 基于数据挖掘的入侵检测系统的优势5.2 基于聚类分析的入侵检测过程5.2.1 数据源分析5.2.2 数据的预处理5.2.3 数据的初始化聚类5.2.4 实验结果分析5.3 本章小结结论参考文献攻读硕士学位期间发表论文和取得的科研成果致谢个人简历
相关论文文献
标签:数据挖掘论文; 聚类分析论文; 模糊均值聚类分析算法论文; 初始化聚类论文; 相异性度量论文;