论文题目: 空间数据挖掘中的分类方法及其应用研究
论文类型: 硕士论文
论文专业: 计算机软件与理论
作者: 吴强
导师: 蒋志方
关键词: 空间数据挖掘,数据离散化,效应平方和,空间谓词,最大熵,空间数据分类,概率粗糙集
文献来源: 山东大学
发表年度: 2005
论文摘要: 随着空间技术在各个行业的应用以及数据挖掘、空间数据采集技术、数据库技术的迅速发展,对从空间数据库发现隐含知识的需求日益增长,出现了用于在空间数据库中进行知识发现的崭新研究领域——空间数据挖掘。空间数据挖掘是从空间数据库中提取隐含的、用户感兴趣的空间、非空间模式和普遍特征的过程,它是多学科和多种技术交叉综合的新领域,综合了机器学习、空间数据库系统、专家系统、可移动计算、统计学、遥感、基于知识的系统、可视化等领域的有关技术。尽管数据挖掘最初产生于关系数据库和事务数据库,但由于空间数据的特殊性,从空间数据库中发掘知识很快引起了数据挖掘研究者的关注。 本文系统的介绍了空间数据挖掘的基本理论,比较传统数据挖掘与空间数据挖掘的不同之处,进而分析了空间数据挖掘中数据分类的研究现状和目前存在的问题。通过对已有方法的研究以及在与统计学、粗糙集理论、信息论等领域相关技术的结合,提出针对空间数据挖掘中连续数据离散化、谓词选取以及数据分类的解决方法,并最终以空间数据挖掘原型系统的形式加以实现。 本文所做的主要工作有以下几个方面: ● 利用统计学中的方差分析方法,本文根据数据总平方和可以分解为效应平方和与误差平方和的思想,提出了基于效应平方和的连续数据离散化算法,先利用直方图法对数据进行初始化,然后计算相应的效应平方和和误差平方和,直至效应平方和最大。 ● 本文利用最大熵原理对不同层次空间对象的空间关系进行分析,采用Kullback-Leibler距离作为迭代条件,使用互信息和Z-测试方法选取最能表征空间对象之间关系的空间谓词及与之相关联的非空间数据集。 ● 空间数据挖掘中需要不确定性处理的一个基本方面是空间对象之间的拓扑关系。本文提出了采用概率粗糙集模型处理空间关系的空间数据分类方法,此方法可以处理空间数据中的不确定性关系,在保持信息分类能力不变的前提下进行数据约简,能够处理多种类型的噪声,输出最终的空间数据分类规则。 ● 通过对空间数据挖掘中数据预处理、空间谓词选取及数据分类的研究,最后实现了一个空间数据挖掘的原型系统。原型系统是在Windows操作系统下,以
论文目录:
摘要
ABSTRACT
第一章 绪论
1.1 数据挖掘的研究现状
1.2 空间数据挖掘概述
1.3 本文的主要工作及其研究意义
1.3.1 空间连续数据离散化的效应平方和算法
1.3.2 空间谓词选取的最大熵方法
1.3.3 空间数据分类的概率粗糙集算法
1.3.4 空间数据挖掘原型系统模型实现
1.4 本文的组织结构
第二章 空间数据挖掘
2.1 空间数据库和空间数据挖掘
2.2 空间数据挖掘的特点
2.3 空间数据挖掘可发现的知识
2.4 空间数据挖掘的常用方法
2.5 国内外空间数据挖掘系统发展概况
2.6 空间数据挖掘面临的问题
第三章 空间连续数据离散化方法
3.1 数据挖掘中常用的离散化方法
3.2 方差分析基本概念
3.2.1 单因素试验
3.2.2 单因素试验方差分析的数学模型
3.2.3 模型的检验统计量
3.3 空间连续数据离散化的效应平方和算法
3.4 算法性能分析
第四章 空间谓词选取的最大熵方法
4.1 空间数据中空间对象属性描述
4.2 信息论中的最大熵原理
4.2.1 样本数据的极大似然表示
4.2.2 特征、特征函数及约束
4.2.3 最大熵原理
4.2.4 参数估计及特征选择
4.3 空间谓词选取的最大熵方法
4.3.1 空间谓词选取的最大熵算法
4.3.2 算法时间复杂度分析
4.3.3 算法特点
第五章 空间数据分类的概率粗糙集算法
5.1 目前空间数据分类的研究状况
5.2 粗糙集理论简介
5.2.1 粗糙集模型的基本概念
5.2.2 信息系统
5.2.3 属性的简化和属性的核
5.2.4 概率粗糙集模型
5.3 空间数据分类的概率粗糙集算法
5.3.1 粗糙集基本算法
5.3.2 计算两个等价类的正则条件熵
5.3.3 计算条件属性相对于决策属性集合的核
5.3.4 空间数据分类的概率粗糙集算法
5.4 分类算法特点与性能分析
5.4.1 算法特点
5.4.2 算法完备性分析
5.4.3 算法时间复杂度分析
5.4.4 实验结果分析
第六章 空间数据挖掘原型系统模型实现
6.1 原型系统实验环境
6.2 空间数据挖掘原型系统实现架构
6.3 结论与展望
参考文献
致谢
攻读学位期间发表的学术论文目录
学位论文评阅及答辩情况表
发布时间: 2005-10-17
参考文献
- [1].空间数据挖掘中的聚类分析研究[D]. 胡红光.西安建筑科技大学2015
- [2].面向网络自媒体的空间数据挖掘研究[D]. 钟宇.江西理工大学2018
- [3].基于云理论的空间数据挖掘技术研究[D]. 刘林.西安电子科技大学2008
- [4].空间数据挖掘及其不确定性研究[D]. 边磊.辽宁工程技术大学2010
- [5].多源地质空间数据挖掘方法及应用[D]. 崔莹.电子科技大学2011
- [6].空间数据挖掘原型系统开发及其应用研究[D]. 李志建.中国地质大学(北京)2009
- [7].城市空间数据挖掘方法与应用研究[D]. 王艳.山东师范大学2004
- [8].基于空间数据挖掘的热门景点及线路推荐研究[D]. 刘勇.华中师范大学2017
- [9].空间数据库的空间数据挖掘技术研究[D]. 姚文杰.贵州大学2008
- [10].空间数据挖掘的聚类方法与应用[D]. 欧阳怡彪.电子科技大学2006
相关论文
- [1].基于空间数据挖掘与知识发现的遥感影像分类研究[D]. 陈小瑜.福建师范大学2007
- [2].关联规则分析及其在空间数据挖掘中的应用研究[D]. 刘永彬.广西大学2007
- [3].空间数据挖掘与GIS集成技术研究[D]. 潘玲.武汉理工大学2007
- [4].空间数据挖掘不确定性的研究[D]. 符晓蓉.武汉理工大学2007
- [5].Rough集和云理论在空间数据挖掘中的应用[D]. 林丽清.北京化工大学2007
- [6].空间数据挖掘技术研究[D]. 李国锋.西安电子科技大学2005
- [7].空间数据库的空间数据挖掘技术研究[D]. 王凌.西安电子科技大学2005
- [8].面向空间数据库的空间数据挖掘应用研究[D]. 唐理兵.安徽大学2005
- [9].空间数据挖掘分类算法的研究[D]. 牛洪琦.大连海事大学2006
- [10].基于聚类的空间数据挖掘方法与应用研究[D]. 赵国富.山东理工大学2006
标签:空间数据挖掘论文; 数据离散化论文; 效应平方和论文; 空间谓词论文; 最大熵论文; 空间数据分类论文; 概率粗糙集论文;