论文摘要
近年来,信息技术的广泛应用,使得人们在各个领域获取的信息量急剧膨胀。面对这些模糊的、不确定的海量信息,人类却陷入了乏力于获取知识的困境。粗糙集理论作为一种处理模糊性、不确定性知识的有效数学工具,它不需要任何先验知识,就可直接对数据进行分析,从中发现隐含的知识。本文将粗糙集理论应用于知识获取领域,对知识获取中的数据离散化、属性约简、以及规则抽取(值约简)做了详细的分析与深入探讨,并将相应的研究成果应用到中医智能诊断系统中。本文主要工作如下:1)针对一般离散化算法不能保证原有信息系统中样本之间的“分辨关系”,以及离散化效果较差的问题,提出一种基于粗糙集的数据离散化算法(DDRS)。该算法利用候选断点在区分矩阵中出现频率大小作为启发信息,逐次选择最重要的断点加入到结果断点集中,并由最终的断点集得离散化后的信息系统。实验结果表明,该算法没有破坏样本之间的“分辨关系”,且具有较好的离散化效果。2)提出一种基于条件熵的启发式属性约简算法(HARE)。该算法以条件熵作为启发信息,缩小搜索空间,降低时间复杂度;并加入了二次约简过程,较好地剔除初次约简中可能存在的冗余属性。实验结果表明,在不提高传统算法时间复杂度的情况下,该算法得到的约简结果更为简单。同时,针对一般属性约简算法不能对不相容决策表进行属性约简问题,给出一种不相容决策表的属性约简算法(ARIT)。该算法以改进的可辨识矩阵为基础,能有效地对不相容决策进行属性约简;同时以属性频率作为启发信息,缩小搜索空间,很好地降低了计算复杂度。3)针对传统值约简算法时间开销较大,获得规则置信度不高。提出一种基于受限区分矩阵的值约简算法(VRDM)。该算法以加权平均的属性值重要度作为启发信息,保证值约简更加合理,最后获取的规则具有较高的置信度;并以受限区分矩阵作为基础,在值约简过程中不需多次遍历决策表,有效地降低计算复杂度。4)在理论研究的基础上,将本文提出的算法应用到实际的中医智能诊断系统中,更好地帮助医生做出快速、正确的决策(诊断)。
论文目录
摘要Abstract第1章 绪论1.1 课题研究背景及意义1.2 粗糙集的发展与研究现状1.2.1 粗糙集的发展1.2.2 粗糙集的研究现状1.3 论文研究内容及结构安排第2章 粗糙集理论基础2.1 引言2.2 粗糙集基本概念2.2.1 信息系统和决策表2.2.2 不可分辨关系2.2.3 粗糙集与近似集2.2.4 粗糙度2.3 知识约简2.3.1 相关概念2.3.2 约简步骤2.4 本章小结第3章 数据离散化算法的研究3.1 引言3.2 离散化问题的描述与分类3.2.1 离散化问题的描述3.2.2 离散化问题的分类3.3 离散化算法介绍3.3.1 非参照性离散化算法3.3.2 布尔逻辑和粗糙集理论相结合的离散化算法3.3.3 基于贪心搜索思想的启发式离散化算法3.3.4 基于属性重要性的离散化算法3.4 基于粗糙集的数据离散化算法3.4.1 离散化的步骤3.4.2 候选断点集合的计算3.4.3 算法描述3.4.4 算法分析3.4.5 实验验证3.5 本章小结第4章 属性约简算法的研究4.1 引言4.2 属性约简算法介绍4.2.1 基于属性依赖度的启发式属性约简算法4.2.2 基于可辨识矩阵和逻辑运算的属性约简算法4.2.3 基于互信息的启发式属性约简算法4.3 基于条件熵的启发式属性约简算法4.3.1 相关概念4.3.2 算法描述4.3.3 算法分析4.3.4 实验验证4.4 不相容决策表的属性约简算法4.4.1 相关定理4.4.2 Skowron可辨识矩阵的局限性4.4.3 改进的可辨识矩阵4.4.4 算法描述4.4.5 算法分析4.4.6 实验验证4.5 本章小结第5章 值约简算法的研究5.1 引言5.2 值约简算法介绍5.1.1 基于决策表的启发式值约简算法5.1.2 基于属性值重要性的启发式值约简算法5.3 基于受限区分矩阵的值约简算法5.3.1 相关概念5.3.2 算法描述5.3.3 算法分析5.3.4 实验验证5.4 本章小结第6章 基于粗糙集的中医中风病智能诊断系统6.1 背景介绍6.1.1 中医诊断背景6.1.2 中医中风病背景6.2 粗糙集方法与中医中风病诊断6.3 中医中风病的智能诊断系统6.3.1 系统的模块结构6.3.2 系统工作流程6.3.3 系统数据库设计6.3.4 系统子模块的设计6.3.5 系统实现6.4 本章小结第7章 总结与展望7.1 总结7.2 展望参考文献攻读硕士学位期间发表的论文致谢
相关论文文献
标签:粗糙集论文; 离散化论文; 属性约简论文; 值约简论文; 知识获取论文;