基于粒度层次的数据挖掘分类算法研究

基于粒度层次的数据挖掘分类算法研究

论文摘要

粒度计算作为近年研究领域的热点,为数据挖掘研究的许多方面提供了概念上的框架。许多学者从不同的视角,不同的概念和模式对粒度计算进行了研究。近年来,粗糙集理论已经变成了粒度计算研究的主要数学模式。分类是数据挖掘和模式识别的主要任务之一。分类有许多不同的表达方式,如分类规则、判别式、决策树和决策表等。本文在粗糙集理论和粒度计算理论的基础上,对数据挖掘的分类算法中进行了研究。本文的主要工作如下:首先,介绍了数据挖掘的基本概念,数据挖掘的基本过程。数据挖掘的模式分为以下几种:分类模式、预测模式、关联规则模式、回归模式、聚类模式、时间序列模式等。不论是哪一种模式,算法都起着非常重要的作用。分类模式算法包括以下几种:决策树分类、贝叶斯分类、支持向量机、神经网络、遗传算法、粗糙集方法。第二章介绍了粗糙集理论和粒度计算理论的相关背景和一些基本概念。并引入了多粒度层次概念。在第三章中,首先介绍了属性约简的基本概念,属性约简中的粒度计算。对粒度计算理论用于分层属性约简进行了研究,并给出粒度计算的属性约简算法。在接下来的两章中,本文提出一种基于粒度层次的决策树分类算法。该算法改进了决策树C4.5算法并引入了粒度概念层次。每个粒度用(属性,值)去定义。基于粒度层次树模型,我们用搜索粒度策略来提取分类规则。在一个粒度层次中,每个结点都是数据对象的子集,连接大粒度到小粒度的弧用一个原子公式(属性,值)定义。最终,树模型中所有最小粒度定义的对象是论域的一个覆盖。在每个粒度层次上的规则都可以从数据集合中导出,从顶层到底层将推导出一个规则。我们用UCI数据集验证上述方法,实验结果表明该算法是非常有效的。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 数据挖掘概述
  • 1.2 数据挖掘过程
  • 1.2.1 数据清理
  • 1.2.2 数据集成
  • 1.2.3 数据选择
  • 1.2.4 数据变换
  • 1.2.5 数据挖掘
  • 1.2.6 模式评估
  • 1.2.7 知识表示
  • 1.3 数据挖掘中分类方法
  • 1.3.1 决策树
  • 1.3.2 AQ11关联规则
  • 1.3.3 贝叶斯分类
  • 1.3.4 支持向量机
  • 1.3.5 神经网络
  • 1.3.6 基于遗传算法的分类
  • 1.3.7 基于粗糙集的分类
  • 1.3.8 分类方法的评估
  • 1.4 本文研究内容
  • 第二章 基于粗糙集的粒度计算理论介绍
  • 2.1 粗糙集理论
  • 2.1.1 信息系统
  • 2.1.2 近似空间
  • 2.1.3 知识约简
  • 2.1.4 知识的依赖性
  • 2.1.5 粗糙集理论与其它智能理论
  • 2.2 粒度与粒度计算(Granular Computing,GrC)
  • 2.2.1 粒度思想的普遍性
  • 2.2.2 粒度计算的定义
  • 2.3 粒度计算的基本成分
  • 2.3.1 粒
  • 2.3.2 粒化和分级的观点
  • 2.3.3 层次
  • 2.3.4 粒结构
  • 2.4 粒度计算模型
  • 2.4.1 决策逻辑语言
  • 2.4.2 信息表
  • 2.4.3 粒度的度量
  • 2.5 粒度计算的粗糙集模型
  • 2.5.1 粗糙集粒度和近似
  • 2.5.2 一般的粗糙集:通过覆盖形成粒度
  • 2.5.3 邻域系统:多层次的粒度
  • 2.5.4 其他研究
  • 2.6 小结
  • 第三章 基于粒度计算的分层属性约简
  • 3.1 属性约简
  • 3.2 约简中的粒度计算
  • 3.2.1 一致性分类问题
  • 3.2.2 约简中的粒度刻画
  • 3.3 基于粒度计算的属性分层约简
  • 3.3.1 基本思想
  • 3.3.2 理论基础
  • 3.3.3 基于粒度分层的属性约简
  • 3.4 示例
  • 3.5 小结
  • 第四章 基于粒度层次树的分类模型
  • 4.1 决策树算法
  • 4.1.1 决策树概述
  • 4.1.2 决策树的优缺点
  • 4.1.3 C4.5(ID3)算法
  • 4.2 粒度层次树分类算法
  • 4.2.1 构造粒度网络
  • 4.2.2 粒度层次树的分类算法-GHDT
  • 4.2.3 与传统决策树算法的不同点
  • 4.3 基于粒度层次树的分类规则提取
  • 4.3.1 规则的定义与产生
  • 4.3.2 规则提取算法描述
  • 4.4 小结
  • 第五章 实验与结果分析
  • 5.1 实验示例
  • 5.1.1 示例
  • 5.1.2 算法实现
  • 5.2 实验与分析
  • 5.2.1 实验一
  • 5.2.2 实验二
  • 5.3 小结
  • 第六章 总结
  • 6.1 工作总结
  • 6.2 进一步的研究工作
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    • [1].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [2].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [3].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [4].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [5].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [6].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [7].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [8].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [9].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [10].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [11].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [12].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [13].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [14].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [15].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [16].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [17].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [18].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [19].浅析数据挖掘[J]. 内江科技 2020(06)
    • [20].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [21].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [22].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [23].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [24].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [25].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [26].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [27].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [28].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [29].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)
    • [30].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(10)

    标签:;  ;  ;  ;  ;  

    基于粒度层次的数据挖掘分类算法研究
    下载Doc文档

    猜你喜欢