核聚类算法及其应用研究

核聚类算法及其应用研究

论文摘要

数据挖掘是信息管理领域中一个重要的研究课题,数据挖掘技术已经广泛地应用到很多行业中。聚类分析是数据挖掘中的核心技术之一,目前聚类算法中应用最广泛的k-means算法虽然简明、实用,但它没有对样本特征进行优化,其有效性很大程度上取决于数据点的分布情况,当样本边界为线性不可分或者样本分布为非高斯分布时,聚类效果较差,无法达到高精确度的聚类要求;而核函数的引入增加了对样本特征的优化,通过将样本点从输入空间映射到高维特征空间,将非线性学习问题转化为线性学习问题,从而实现了更为准确的聚类。而目前核聚类算法中的硬划分方法缺乏健壮性,模糊聚类方法又存在需要人为定义模糊参数等不足,因此有待于进一步改进。本文提出一种改进的模糊核聚类算法——它是将HCM,FCM和核方法结合在一起,该算法的思想是将样本数据映射到特征空间,然后在特征空间内计算类中心、隶属度以及距离表达式,再在特征空间内进行模糊聚类,并且对那些个别样本(即隶属度比较接近的样本)加入了截集因子λ确定样本的归属,确保聚类的效果。实际数据的实验结果表明,与传统的模糊聚类算法相比,改进的模糊核聚类算法在多种数据结构条件下可以有效地进行聚类,总体性能优于HCM,FCM和FKCM。最后将该算法应用到入侵检测技术中,因聚类效果的提高,有效的检测了入侵攻击,并用仿真实验证明该算法入侵检测的有效性

论文目录

  • 中文摘要
  • 英文摘要
  • 1 绪论
  • 1.1 背景与意义
  • 1.2 核方法研究进展
  • 1.3 核聚类研究进展
  • 1.4 本文的主要内容
  • 1.5 论文架构
  • 2 聚类分析与核方法
  • 2.1 聚类分析
  • 2.1.1 聚类分析的概念
  • 2.1.2 聚类分析的应用
  • 2.1.3 聚类分析的要求
  • 2.1.4 聚类分析中的聚类准则函数
  • 2.1.5 聚类算法的种类
  • 2.1.6 常用聚类算法的比较分析
  • 2.1.7 聚类算法的总结
  • 2.2 核方法的基本知识
  • 2.2.1 引言
  • 2.2.2 基本知识
  • 2.2.3 积特征
  • 2.2.4 再生核理论与 MERCER定理
  • 2.2.5 核方法总结
  • 3 一种改进的模糊核聚类算法
  • 3.1 引言
  • 3.2 模糊聚类算法
  • 3.3 截集模糊聚类算法
  • 3.4 一种改进后的模糊核聚类算法
  • 3.4.1 流程图
  • 3.4.2 数值仿真
  • 3.4.3 实验结果与性能比较
  • 4 模糊核聚类算法在入侵检测中的应用
  • 4.1 入侵检测概述
  • 4.1.1 入侵检测技术背景
  • 4.1.2 通用入侵检测模型
  • 4.1.3 入侵检测数据源
  • 4.1.4 入侵检测与人工智能的结合
  • 4.1.5 评枯入侵检测系统的性能
  • 4.2 基于聚类的入侵检测方法
  • 4.2.1 在入侵检测中使用聚类技术
  • 4.2.2 利用核聚类算法检测攻击
  • 4.3 具体实验分析
  • 4.3.1 实验数据集
  • 4.3.2 数据预处理
  • 4.3.3 实验结果
  • 4.4 小结
  • 总结与展望
  • 参考文献
  • 科研成果简介
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    核聚类算法及其应用研究
    下载Doc文档

    猜你喜欢