论文题目: 基于划分的聚类算法研究
论文类型: 硕士论文
论文专业: 计算机技术
作者: 郑柏杰
导师: 杨小帆,何国辉
关键词: 数据挖掘,聚类分析,划分方法
文献来源: 重庆大学
发表年度: 2005
论文摘要: 由于计算机数据采集工具及关系数据库技术的发展,目前各个行业都存储了大量的数据。传统的数据分析手段难以应付大量的数据,从而导致越来越严重的数据灾难,数据挖掘技术的发展为解决这一问题提供了有效途径。数据挖掘(Data Mining),也称数据库的知识发现(Knowledge Discovery in database),是指从大量的原始数据中挖掘出隐含的、有用的、尚未发现的知识和信息。与传统的统计、总结方法相比,数据挖掘技术涉及到多个学科,汇集了人工智能、模式识别、数据库、机器学习以及管理信息系统等学科的成果。数据挖掘是一个新兴的边缘学科,其应用领域非常广泛,并具有良好的应用前景。聚类分析是数据挖掘的重要组成部分。所谓聚类,是将一个数据单位的集合(数据源)分割成几个称为簇或类别的子集。聚类分析依据的原则是使同一聚簇中的对象具有尽可能大的相似性,而不同聚簇中的对象具有尽可能大的相异性。聚类分析主要解决的问题是如何在没有先验知识的前提下,实现满足这种要求的聚簇的集合。本文主要工作包括:(1)首先介绍了什么是数据挖掘,包括数据挖掘的产生背景和定义,然后介绍了目前国内外数据挖掘中研究的一部分重要内容的概况,包括关联规则、数据综合和概括、数据分类、数据聚类等,最后介绍了数据挖掘在研究和应用中所面临的挑战,正是这些挑战推动了数据挖掘研究的进一步发展。(2)对现有的各种聚类分析算法的对比性研究。(3)基于划分的聚类方法的改进。基于划分的方法是聚类分析中较为主要的方法之一,但是由于它对于先验知识的依赖较强,尤其是需要预先指定聚类分析的类别数目,给该方法的应用带来了障碍。本文提出了对基于划分的方法的改进方法,它不但避免了需要用户给出难以确定的参数的尴尬局面,而且可以发现任意形状的簇,是一个非常有优势有前景的算法。最后详细介绍了该算法的具体实现,并把它应用到一个实例中。
论文目录:
摘 要
ABSTRACT
1 引言
1.1 数据挖掘的起源
1.2 数据挖掘与专家系统的区别
1.3 数据挖掘的分类
1.4 数据挖掘的系统结构及流程
1.5 数据挖掘的研究与应用
1.6 本文的主要工作
2 数据挖掘的任务与方法
2.1 数据挖掘的任务
2.2 数据挖掘的方法
3 聚类分析方法
3.1 什么是聚类分析
3.2 聚类分析评价标准
3.3 聚类算法涉及的各类型数据及预处理
3.4 聚类分析方法详解
3.5 聚类分析目前存在的问题
4 一种改进的基于划分的聚类分析方法
4.1 对基于划分的聚类算法的分析
4.2 对基于划分的经典算法的一些改进
5 结论
致谢
参考文献
独创性声明
学位论文版权使用授权书
发布时间: 2006-12-05
参考文献
- [1].数据挖掘中几种划分聚类算法的比较及改进[D]. 彭丽.大连理工大学2008
- [2].基于密度的数据流聚类算法研究[D]. 李省委.西安电子科技大学2017
- [3].分布式聚类算法研究及其应用[D]. 徐军莉.南昌大学2009
- [4].基于距离的聚类和孤立点检测算法研究[D]. 尚俊平.郑州大学2005
- [5].数据挖掘中聚类算法研究与改进及其应用[D]. 刘禹.辽宁科技大学2014
- [6].聚类与孤立点检测算法的研究和实现[D]. 刘俊岭.中国科学院研究生院(沈阳计算技术研究所)2006
- [7].聚类算法及其在高职院校学生信息管理系统中的应用研究[D]. 解英杰.山东师范大学2012
- [8].大规模科学数据挖掘中密度聚类算法的研究[D]. 熊小勇.电子科技大学2007
- [9].基于粒计算的聚类算法研究[D]. 程顺宽.南昌大学2015
- [10].聚类算法的研究与应用[D]. 李引.江南大学2013
相关论文
- [1].数据挖掘中几种划分聚类算法的比较及改进[D]. 彭丽.大连理工大学2008
- [2].k-means类型变量加权聚类算法的研究与实现[D]. 李晓明.哈尔滨工业大学2006
- [3].聚类问题算法研究[D]. 李广斌.浙江师范大学2006
- [4].数据挖掘中聚类分析的研究与应用[D]. 周东华.天津大学2006
- [5].聚类算法及其应用研究[D]. 何虎翼.上海交通大学2007
- [6].聚类分析中k-均值方法的研究[D]. 于翔.哈尔滨工程大学2007
- [7].聚类算法的研究[D]. 李东琦.西南交通大学2007
- [8].K-means聚类算法研究及应用[D]. 张建辉.武汉理工大学2007