论文题目: 基于粗糙集和数据库技术的知识发现与推理方法研究
论文类型: 博士论文
论文专业: 管理科学与工程
作者: 乔梅
导师: 韩文秀
关键词: 粗糙集,数据库技术,知识发现,知识推理,属性分类粗糙度,预剪枝
文献来源: 天津大学
发表年度: 2005
论文摘要: 基于数据库的知识发现(KDD)又称数据挖掘(DM)是一种新的用于对数据库中大量数据进行处理的智能信息处理技术,是构建智能商务、新型决策支持系统等新型智能信息系统的一种基本构件,是当前智能信息技术研究的热点。粗糙集(Roug集)理论是波兰数学家Pawlak提出的一种研究不精确和不确定问题的数学工具。是目前公认的研究数据挖掘、知识约简和粒计算等的理论基础。数据库技术是管理和操纵数据库中大量数据的最先进最有效的技术。充分利用数据库技术所具有的对数据库中数据操作的优势,来改进或设计新的适合于大数据集的高效数据挖掘算法,是许多学者正在探索的一个有效途径。本文以粗糙集理论作为研究的主要理论依据,并充分考虑和运用数据库技术的优越性,对目前数据挖掘中存在的一些问题进行了研究,提出了有效可行的解决方案。本文研究内容如下:1.对属性约简算法中基于分辨矩阵求取核属性的时空代价以及必要性进行了分析,基于Rough集的有关理论和数据库技术对基于粗糙集的属性约简算法进行了改进,实验表明在大数据集上该算法的效率大大高于一些基于主存的属性约简算法,且易于实现和使用。2.针对Rough集中刻画属性分类能力的主要机制正区域等不能全面地反映属性对分类贡献能力的问题,提出了一个在Rough集中刻画属性分类综合贡献能力的测度——属性分类粗糙度,理论分析和实验表明,作为分类算法中选择属性的测度,该测度优于信息增益,且与信息增益率相当,且计算更为简单。并基于该测度和本文其它有关研究提出了一个具有良好可扩展性和适应性的分类算法,该算法可直接生成决策树或分类规则。3.分析了目前数据挖掘算法在处理噪音数据、不一致数据方面存在的问题,基于可变精度Rough集模型提出了一个在基于等价类的分部寻优归纳的分类算法(如决策树算法)中更有效的处理噪音数据的新方法——预剪枝方法;并基于Rough集的有关理论提出了一种可与这种归纳分类方法高度融合的检测和处理不相容数据的简单有效的方法。4.提出了一个利用关系数据库组织逻辑上为树形结构的知识库的方法,以及在这种知识库组织方式的基础上基于数据库查询的推理方法。
论文目录:
第一章 绪论
1.1 选题背景与研究意义
1.2 粗糙集理论研究与应用研究综述
1.2.1 粗糙集在属性约简上的应用综述
1.2.2 粗糙集在分类挖掘上的应用综述
1.2.3 粗糙集在异常数据处理上的应用综述
1.3 基于数据库技术的推理方法综述
1.4 本文主要研究内容与创新点
第二章 粗糙集理论概述
2.1 粗糙集知识发现方法的研究与发展
2.2 粗糙集基本与扩展模型
2.2.1 基本粗糙集模型
2.2.2 可变精度粗糙集模型
2.2.3 相似粗糙集模型
2.3 粗糙集知识发现方法与系统
2.4 粗糙集知识发现研究的展望
第三章 基于粗糙集和数据库技术的属性约简算法研究
3.1 属性约简及其在数据挖掘中的作用
3.2 属性约简算法研究现状及存在问题分析
3.3 利用分辨矩阵计算核属性的必要性及代价分析
3.3.1 利用分辨矩阵求取核属性的必要性分析
3.3.2 利用分辨矩阵求取核属性的时间代价和空间代价分析
3.4 基于粗糙集的属性约简改进算法
3.5 改进算法的特性分析
3.5.1 算法正确性验证
3.5.2 算法效率分析
本章小结
第四章 基于粗糙集和数据库技术的分类算法研究
4.1 分类算法及基于粗糙集的分类算法研究现状
4.1.1 分类算法研究现状
4.1.2 基于粗糙集的分类算法的研究现状
4.1.3 两种主要的归纳分类方法及特性分析
4.2 基于粗糙集的分类算法研究
4.2.1 粗糙集辨识对象的基本方法
4.2.2 算法的归纳策略及选择属性的测度
4.2.3 正区域与互信息熵的关系
4.3 基于粗糙集正区域的分类算法及特性分析
4.3.1 基于粗糙集正区域的分类算法
4.3.2 算法实验及特性分析
本章小结
第五章 粗糙集中属性分类贡献能力综合测度研究
5.1 引言
5.2 相关研究
5.3 属性分类贡献能力测度及其特性分析
5.3.1 评判属性分类贡献能力的因素分析
5.3.2 属性相关纯度及属性相关粗糙度
5.3.3 属性相关纯度及属性相关粗糙度特性分析
5.4 几种选择属性测度的比较分析
5.4.1 决策树算法中几种选择属性的测度及其特性分析
5.4.2 用于测试属性选择测度性能的决策树算法
5.4.3 实验结果及分析
本章小结
第六章 基于变精度粗糙集的噪音数据处理方法研究
6.1 决策树算法中目前的噪音数据处理方法及存在问题
6.2 变精度粗糙集模型及其应用现状
6.2.1 变精度粗糙集模型
6.2.2 变精度粗糙集在数据挖掘研究中的应用状况
6.3 基于变精度粗糙集的处理噪音数据的新方法
6.4 基于变精度粗糙集的改进的分类算法及实验验证
6.4.1 改进的ID3 算法
6.4.2 算法性能测试
本章小结
第七章 不相容数据检测处理方法研究
7.1 不相容数据及其产生原因
7.2 不相容数据处理的相关研究
7.3 不相容数据检测方法
7.4 不相容数据的处理策略及叶节点的决策质量参数
7.4.1 处理策略
7.4.2 决策质量参数
7.5 改进算法及算例
本章小结
第八章 基于数据库技术的知识推理方法研究
8.1 概述
8.2 决策树的数据库组织
8.3 基于数据库查询的推理方法
8.4 推理效率分析及推理效率提高的方法
本章小结
第九章 基于Rough 集和数据库技术的KDD 系统设计
9.1 KDD 概述
9.2 系统结构设计及功能
9.3 挖掘算法
9.4 系统特点
本章小结
第十章 总结与展望
10.1 全文总结
10.2 研究展望
参考文献
发表论文和参加科研情况说明
致谢
发布时间: 2006-05-24
参考文献
- [1].基于覆盖的概率粗糙集和L-模糊变精度粗糙集研究[D]. 黎文善(LE VAN THIEN).武汉大学2015
- [2].代价敏感粒计算若干方法的研究[D]. 廖淑娇.电子科技大学2018
- [3].基于粗糙集的过程建模、控制与故障诊断[D]. 谭天乐.浙江大学2003
- [4].粗糙集理论分层递阶约简算法的研究[D]. 乔斌.浙江大学2003
- [5].知识获取中的Rough Sets理论及其应用研究[D]. 马玉良.浙江大学2005
- [6].粗糙集—神经网络智能系统在浮选过程中的应用研究[D]. 张勇.大连理工大学2006
- [7].基于粗糙集的故障诊断和容错控制理论和方法研究[D]. 高赟.西安科技大学2005
- [8].基于粗糙集的数据挖掘方法研究[D]. 王庆东.浙江大学2005
- [9].基于粗糙集的数据挖掘算法研究[D]. 刘文军.北京师范大学2004
- [10].基于粗糙集的交叉研究及其在中医诊断的应用[D]. 秦中广.华南理工大学2002