论文摘要
近年来,基于网格聚类算法的研究己经成为数据挖掘研究领域中非常活跃的一个研究课题。本文在研究传统聚类算法的基础上,给出基于优化网格的最小生成树聚类算法(OGMST)。该算法利用参数自动化的密度阈值处理技术,来解决基于网格的最小生成树聚类算法不适用于多密度数据集的局限性,同时为了提高现有的多密度聚类算法的精度,引入边界点提取技术提取边界点。引入网格相似度的计算,改进基于网格相似度的聚类算法。相似度度量标准综合考虑了距离和网格密度对聚类结果的影响,同时还利用信息熵的概念对高维数据集进行处理。
论文目录
摘要ABSTRACT第一章 引言1.1 研究背景与意义1.2 研究内容与思路1.3 论文的组织结构第二章 数据挖掘技术与聚类算法分析2.1 数据挖掘概述2.1.1 数据挖掘的定义2.1.2 数据挖掘的过程2.1.3 数据挖掘的任务2.1.4 数据挖掘的应用2.1.5 数据挖掘的方法2.2 聚类分析概述2.2.1 主要的聚类分析方法2.2.2 基于密度的聚类算法2.3 基于网格的聚类算法2.3.1 传统的网格聚类算法2.3.2 一些改进的网格聚类算法2.4 本章小结第三章 基于优化网格的最小生成树聚类算法OGMST3.1 基于优化网格的最小生成树聚类算法概述3.2 相关技术3.2.1 相关定义3.2.2 密度阈值处理技术3.2.3 边界点提取技术3.3 基于优化网格的最小生成树聚类算法描述3.3.1 构建最小生成树3.3.2 OGMST 算法的主要思想3.3.3 OGMST 算法3.3.4 算法复杂度分析3.4 实验对比与分析3.4.1 算法正确性分析3.4.2 算法精度对比3.4.3 算法时间对比3.5 本章小结第四章 基于网格相似度的聚类算法GSCA4.1 基于网格相似度的聚类算法简介4.2 相关技术4.2.1 相关概念4.2.2 高维数据集的处理技术4.2.3 密度阈值处理技术4.3 基于网格相似度的聚类算法4.3.1 相似度标准的引入4.3.2 GSCA 算法的主要思想4.3.3 算法描述4.3.4 算法复杂度分析4.4 实验对比与分析4.4.1 算法正确性分析4.4.2 算法精度对比4.4.3 算法时间对比4.5 本章小结第五章 总结及进一步工作展望参考文献致谢在学期间发表的学术论文和参加科研情况
相关论文文献
标签:网格聚类论文; 密度阈值论文; 边界点论文; 相似度论文;