基于粗糙集的知识获取技术研究及其应用

基于粗糙集的知识获取技术研究及其应用

论文摘要

近年来,信息技术的广泛应用,使得人们在各个领域获取的信息量急剧膨胀。面对这些模糊的、不确定的海量信息,人类却陷入了乏力于获取知识的困境。粗糙集理论作为一种处理模糊性、不确定性知识的有效数学工具,它不需要任何先验知识,就可直接对数据进行分析,从中发现隐含的知识。本文将粗糙集理论应用于知识获取领域,对知识获取中的数据离散化、属性约简、以及规则抽取(值约简)做了详细的分析与深入探讨,并将相应的研究成果应用到中医智能诊断系统中。本文主要工作如下:1)针对一般离散化算法不能保证原有信息系统中样本之间的“分辨关系”,以及离散化效果较差的问题,提出一种基于粗糙集的数据离散化算法(DDRS)。该算法利用候选断点在区分矩阵中出现频率大小作为启发信息,逐次选择最重要的断点加入到结果断点集中,并由最终的断点集得离散化后的信息系统。实验结果表明,该算法没有破坏样本之间的“分辨关系”,且具有较好的离散化效果。2)提出一种基于条件熵的启发式属性约简算法(HARE)。该算法以条件熵作为启发信息,缩小搜索空间,降低时间复杂度;并加入了二次约简过程,较好地剔除初次约简中可能存在的冗余属性。实验结果表明,在不提高传统算法时间复杂度的情况下,该算法得到的约简结果更为简单。同时,针对一般属性约简算法不能对不相容决策表进行属性约简问题,给出一种不相容决策表的属性约简算法(ARIT)。该算法以改进的可辨识矩阵为基础,能有效地对不相容决策进行属性约简;同时以属性频率作为启发信息,缩小搜索空间,很好地降低了计算复杂度。3)针对传统值约简算法时间开销较大,获得规则置信度不高。提出一种基于受限区分矩阵的值约简算法(VRDM)。该算法以加权平均的属性值重要度作为启发信息,保证值约简更加合理,最后获取的规则具有较高的置信度;并以受限区分矩阵作为基础,在值约简过程中不需多次遍历决策表,有效地降低计算复杂度。4)在理论研究的基础上,将本文提出的算法应用到实际的中医智能诊断系统中,更好地帮助医生做出快速、正确的决策(诊断)。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究背景及意义
  • 1.2 粗糙集的发展与研究现状
  • 1.2.1 粗糙集的发展
  • 1.2.2 粗糙集的研究现状
  • 1.3 论文研究内容及结构安排
  • 第2章 粗糙集理论基础
  • 2.1 引言
  • 2.2 粗糙集基本概念
  • 2.2.1 信息系统和决策表
  • 2.2.2 不可分辨关系
  • 2.2.3 粗糙集与近似集
  • 2.2.4 粗糙度
  • 2.3 知识约简
  • 2.3.1 相关概念
  • 2.3.2 约简步骤
  • 2.4 本章小结
  • 第3章 数据离散化算法的研究
  • 3.1 引言
  • 3.2 离散化问题的描述与分类
  • 3.2.1 离散化问题的描述
  • 3.2.2 离散化问题的分类
  • 3.3 离散化算法介绍
  • 3.3.1 非参照性离散化算法
  • 3.3.2 布尔逻辑和粗糙集理论相结合的离散化算法
  • 3.3.3 基于贪心搜索思想的启发式离散化算法
  • 3.3.4 基于属性重要性的离散化算法
  • 3.4 基于粗糙集的数据离散化算法
  • 3.4.1 离散化的步骤
  • 3.4.2 候选断点集合的计算
  • 3.4.3 算法描述
  • 3.4.4 算法分析
  • 3.4.5 实验验证
  • 3.5 本章小结
  • 第4章 属性约简算法的研究
  • 4.1 引言
  • 4.2 属性约简算法介绍
  • 4.2.1 基于属性依赖度的启发式属性约简算法
  • 4.2.2 基于可辨识矩阵和逻辑运算的属性约简算法
  • 4.2.3 基于互信息的启发式属性约简算法
  • 4.3 基于条件熵的启发式属性约简算法
  • 4.3.1 相关概念
  • 4.3.2 算法描述
  • 4.3.3 算法分析
  • 4.3.4 实验验证
  • 4.4 不相容决策表的属性约简算法
  • 4.4.1 相关定理
  • 4.4.2 Skowron可辨识矩阵的局限性
  • 4.4.3 改进的可辨识矩阵
  • 4.4.4 算法描述
  • 4.4.5 算法分析
  • 4.4.6 实验验证
  • 4.5 本章小结
  • 第5章 值约简算法的研究
  • 5.1 引言
  • 5.2 值约简算法介绍
  • 5.1.1 基于决策表的启发式值约简算法
  • 5.1.2 基于属性值重要性的启发式值约简算法
  • 5.3 基于受限区分矩阵的值约简算法
  • 5.3.1 相关概念
  • 5.3.2 算法描述
  • 5.3.3 算法分析
  • 5.3.4 实验验证
  • 5.4 本章小结
  • 第6章 基于粗糙集的中医中风病智能诊断系统
  • 6.1 背景介绍
  • 6.1.1 中医诊断背景
  • 6.1.2 中医中风病背景
  • 6.2 粗糙集方法与中医中风病诊断
  • 6.3 中医中风病的智能诊断系统
  • 6.3.1 系统的模块结构
  • 6.3.2 系统工作流程
  • 6.3.3 系统数据库设计
  • 6.3.4 系统子模块的设计
  • 6.3.5 系统实现
  • 6.4 本章小结
  • 第7章 总结与展望
  • 7.1 总结
  • 7.2 展望
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于粗糙集的知识获取技术研究及其应用
    下载Doc文档

    猜你喜欢