网格聚类算法的研究

网格聚类算法的研究

论文摘要

近年来,基于网格聚类算法的研究己经成为数据挖掘研究领域中非常活跃的一个研究课题。本文在研究传统聚类算法的基础上,给出基于优化网格的最小生成树聚类算法(OGMST)。该算法利用参数自动化的密度阈值处理技术,来解决基于网格的最小生成树聚类算法不适用于多密度数据集的局限性,同时为了提高现有的多密度聚类算法的精度,引入边界点提取技术提取边界点。引入网格相似度的计算,改进基于网格相似度的聚类算法。相似度度量标准综合考虑了距离和网格密度对聚类结果的影响,同时还利用信息熵的概念对高维数据集进行处理。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 研究背景与意义
  • 1.2 研究内容与思路
  • 1.3 论文的组织结构
  • 第二章 数据挖掘技术与聚类算法分析
  • 2.1 数据挖掘概述
  • 2.1.1 数据挖掘的定义
  • 2.1.2 数据挖掘的过程
  • 2.1.3 数据挖掘的任务
  • 2.1.4 数据挖掘的应用
  • 2.1.5 数据挖掘的方法
  • 2.2 聚类分析概述
  • 2.2.1 主要的聚类分析方法
  • 2.2.2 基于密度的聚类算法
  • 2.3 基于网格的聚类算法
  • 2.3.1 传统的网格聚类算法
  • 2.3.2 一些改进的网格聚类算法
  • 2.4 本章小结
  • 第三章 基于优化网格的最小生成树聚类算法OGMST
  • 3.1 基于优化网格的最小生成树聚类算法概述
  • 3.2 相关技术
  • 3.2.1 相关定义
  • 3.2.2 密度阈值处理技术
  • 3.2.3 边界点提取技术
  • 3.3 基于优化网格的最小生成树聚类算法描述
  • 3.3.1 构建最小生成树
  • 3.3.2 OGMST 算法的主要思想
  • 3.3.3 OGMST 算法
  • 3.3.4 算法复杂度分析
  • 3.4 实验对比与分析
  • 3.4.1 算法正确性分析
  • 3.4.2 算法精度对比
  • 3.4.3 算法时间对比
  • 3.5 本章小结
  • 第四章 基于网格相似度的聚类算法GSCA
  • 4.1 基于网格相似度的聚类算法简介
  • 4.2 相关技术
  • 4.2.1 相关概念
  • 4.2.2 高维数据集的处理技术
  • 4.2.3 密度阈值处理技术
  • 4.3 基于网格相似度的聚类算法
  • 4.3.1 相似度标准的引入
  • 4.3.2 GSCA 算法的主要思想
  • 4.3.3 算法描述
  • 4.3.4 算法复杂度分析
  • 4.4 实验对比与分析
  • 4.4.1 算法正确性分析
  • 4.4.2 算法精度对比
  • 4.4.3 算法时间对比
  • 4.5 本章小结
  • 第五章 总结及进一步工作展望
  • 参考文献
  • 致谢
  • 在学期间发表的学术论文和参加科研情况
  • 相关论文文献

    标签:;  ;  ;  ;  

    网格聚类算法的研究
    下载Doc文档

    猜你喜欢