粗糙集在数据挖掘中的应用研究

粗糙集在数据挖掘中的应用研究

论文题目: 粗糙集在数据挖掘中的应用研究

论文类型: 硕士论文

论文专业: 管理科学与工程

作者: 仇丽青

导师: 赵庆祯

关键词: 数据挖掘,粗糙集理论,属性约简,属性值约简

文献来源: 山东师范大学

发表年度: 2005

论文摘要: 当今,社会已经进入了网络信息时代,计算机与网络技术的飞速发展使整个应用领域的数据和信息急速增加,并且由于人类的参与,数据与信息系统中的不确定性更加显著。因此,如何从大量的、杂乱无章的、强干扰的数据中挖掘出潜在的、有利用价值的信息,便成为人类智能信息处理中面临的前所未有的挑战。由此产生了人工智能研究的一个崭新领域——数据挖掘(DM)。目前,数据挖掘中常用到的技术有:统计分析方法、决策树、神经网络、遗传算法、模糊集方法、粗糙集理论、可视化技术等等。在诸多方法中,粗糙集理论与方法对于处理复杂系统不失为一种较为有效的方法。粗糙集理论是近年来发展起来的一种处理不精确、不完全信息的软计算方法。该理论是波兰数学家Z.Pawlak 于1982 年提出的一种数据分析理论。它的主要思想是:在保持信息系统分类能力不变的前提下,通过知识约简导出问题的分类或决策规则。将粗糙集理论应用于数据挖掘具有明显的优越性——它无需提供所需处理的数据集合之外的任何先验信息,利用数据集上的等价关系对知识的不确定程度进行度量,从而避免了对知识的主观评价(如证据理论中的信念函数,模糊理论中的隶属度函数)所带来的误差。恰恰是这一点,使粗糙集理论在数据挖掘中具有更强的生命力。目前,粗糙集理论被成功应用于机器学习、人工智能、模式识别、智能信息处理等领域。目前,国内学界虽然对粗糙集理论有一定的认识,但是对于它在数据挖掘中的应用还重视不够,对不同类型的决策表的属性约简、值约简还未提出高效率的、可行的算法。即使有,也不能够很好地进行处理,存在一定的缺点。这大大地阻碍了粗糙集理论在实际中的应用。本文针对粗糙集理论研究背景和研究现状,将对以下内容进行研究:首先对数据挖掘进行简单的介绍,并对粗糙集应用于数据挖掘进行了可行性研究,阐述了利用粗糙集进行数据挖掘的基本步骤;接着介绍了粗糙集理论的理论基础,包括信息系统、等价类和不可分辨关系、上下近似集等;还详细介绍了粗糙集的约简和核的概念,它们是粗糙集的精华;然后介绍了数据离散化的问题,提出了基

论文目录:

摘要

ABSTRACT

前言

1.1 粗糙集理论的研究背景

1.2 粗糙集理论的研究现状

1.3 本文的主要工作

1.4 本文的创新点

第一章 数据挖掘概述

1.1 数据挖掘的基本概念

1.2 数据挖掘的任务

1.3 数据挖掘的方法

1.4 粗糙集应用于数据挖掘的可行性研究

第二章 粗糙集理论

2.1 粗糙集的理论基础

2.1.1 信息系统

2.1.2 等价类和不可分辨关系

2.1.3 粗糙集的上、下近似集

2.2 粗糙集的约简与核

2.2.1 粗糙集的属性约简

2.2.2 粗糙集的值约简

2.3 粗糙集方法与其他方法的关系

第三章 数据的离散化

3.1 数据离散化方法

3.2 粗糙集中离散化问题的描述

3.3 基于自组织特征映射网络的连续属性值离散处理

3.3.1 自组织特征映射网络简介

3.3.2 方法的核心思想

3.3.3 算法分析

3.3.4 算法的创新点

第四章 数据的属性约简

4.1 经典的粗糙集数据约简算法

4.2 基于属性熵的兴趣度属性约简算法

4.2.1 信息熵

4.2.2 属性的重要性

4.2.3 最小支持度

4.2.4 算法的循环终止条件

4.2.5 基于属性熵的兴趣度算法设计

4.3 算法复杂度分析

4.4 算法的创新点

第五章 数据的值约简

5.1 经典的粗糙集值约简方法

5.2 基于Apriori性质的属性值约简算法

5.2.1 Apriori性质

5.2.2 支持度和可信度

5.2.3 基于Apriori性质的属性值约简算法设计

5.3 算法分析

5.4 算法的创新点

第六章 有关数据约简算法的几种特例

6.1 对相同样本的处理

6.2 对矛盾数据的处理

6.3 对新增例子的处理

6.4 对不全数据的处理

结束语

参考文献

研究生期间已(待)发表学术论文

致谢

发布时间: 2005-09-26

参考文献

  • [1].基于粗糙集的图匹配算法[D]. 张鑫.西安建筑科技大学2018
  • [2].基于优势关系的增量信息系统属性约简方法研究[D]. 陈扬.哈尔滨工业大学2018
  • [3].粗糙集在数据挖掘不确定性问题中的研究[D]. 魏悦亮.中国石油大学2010
  • [4].基于粗糙集理论的空间数据挖掘研究[D]. 覃伟荣.广西大学2008
  • [5].基于粗糙集理论和神经网络的图像识别系统[D]. 胡卫东.电子科技大学2011
  • [6].基于粗糙集理论的决策树生成与剪枝方法[D]. 王名扬.东北师范大学2005
  • [7].基于粗糙集理论的图像分割研究[D]. 谢琪.中南大学2011
  • [8].基于粗糙集理论的数据分类及其在医学图像识别中的应用研究[D]. 程鹏.江苏大学2007
  • [9].关于数据挖掘方法中粗糙集理论的研究及应用浅析[D]. 王立梅.中国石油大学2010
  • [10].粗糙集的不确定性度量及其在文本分类中的应用研究[D]. 杨帅华.重庆邮电大学2017

相关论文

  • [1].基于粗糙集的数据挖掘改进的属性约简算法研究[D]. 王丽娜.电子科技大学2012
  • [2].基于粗糙集理论的数据挖掘方法研究及应用[D]. 汪水友.电子科技大学2008
  • [3].基于粗糙集的数据挖掘方法研究[D]. 熊芯.哈尔滨工程大学2009
  • [4].基于粗糙集的数据挖掘算法的研究与应用[D]. 洪雪飞.北京交通大学2008
  • [5].基于粗糙集理论的数据挖掘算法研究[D]. 旷海兰.长沙理工大学2006
  • [6].粗糙集在海量科学数据挖掘中的应用[D]. 葛丽.电子科技大学2005
  • [7].基于粗糙集理论的数据挖掘算法研究[D]. 曾维宏.郑州大学2005
  • [8].粗糙集及其在数据挖掘中的应用研究[D]. 孙栋.西北大学2006
  • [9].基于粗糙集理论的数据挖掘方法的研究[D]. 李明祥.山东科技大学2003
  • [10].基于粗糙集理论的数据挖掘研究[D]. 王书青.河北农业大学2004

标签:;  ;  ;  ;  

粗糙集在数据挖掘中的应用研究
下载Doc文档

猜你喜欢