论文摘要
可拓数据挖掘利用可拓学理论和方法挖掘企业数据库中的潜在有用知识,为企业竞争、生产决策和解决矛盾问题提供帮助。目前,可拓分类知识挖掘是可拓数据挖掘的主要研究内容。传统的可拓分类知识挖掘使用的综合关联函数的权值需要由相关领域的专家给出,具有一定的主观性和不确定性;同时,该领域中可拓集合和可拓变换相关内容还处于概念阶段,缺乏具体的操作方法。针对上述不足,本文采用了基于区间的方法来挖掘可拓分类知识,主要工作如下:1、提出了基于值域覆盖确定关联函数权值的方法。该方法根据关联函数的原理,以不同类别的属性取值范围的覆盖程度作为获得权值的依据,从数据本身入手,寻找能够得到最佳分类效果的属性权重。2、提出了基于区间映射的可拓变换方法,为可拓变换提供一条具体的实施办法,同时将可拓变换的作用域从全体论域缩小到某一类别的数据,进而改进可拓集合的表示。3、将传统的可拓集合只针对二元分类的情况进行了改进。当数据样本为多元分类的情况时,为可拓变换作用的类别与其他所有类别之间建立质变域和量变域。进而对多元分类数据的可拓集合进行了演示。经过UCI数据验证,改进的关联函数方法不仅在准确率上优于其他经典分类算法,在运算速度上同样占有优势。而本文提出的可拓变换以及改变后的可拓集合也能够为决策者提供决策方案。
论文目录
摘要ABSTRACT第一章 绪论1.1 课题的研究背景1.1.1 可拓数据挖掘的产生1.1.2 可拓数据挖掘的概念1.1.3 可拓数据挖掘的研究现状及发展趋势1.2 课题的研究内容1.3 论文组织结构第二章 背景知识2.1 数据挖掘中的分类算法2.1.1 决策树2.1.2 简单贝叶斯分类2.1.3 人工神经网络2.2 可拓数据挖掘2.2.1 挖掘可拓分类知识2.2.2 挖掘传导知识2.3 本章小结第三章 关联函数分类3.1 数据预处理3.1.1 去除离群点3.1.2 物元描述3.2 改进的综合关联函数分类方法3.2.1 传统的关联函数分类方法3.2.2 获取值域覆盖程度3.2.3 获取权值3.3 本章小结第四章 获取可拓知识4.1 建立可拓变换4.1.1 可拓变换的目的和意义4.1.2 基于区间映射的可拓变换方法4.2 建立可拓集合4.2.1 传统的可拓集合4.2.2 可拓变换的选择4.2.3 质变域和量变域的描述4.2.4 完整的可拓集合4.3 可拓分类知识表示4.4 本章小结第五章 UCI数据集验证5.1 UCI数据集介绍5.2 改进的关联函数分类算法结果比较5.3 UCI数据集的可拓分类知识表示5.4 本章小结第六章 总结与展望6.1 工作总结6.2 工作展望参考文献致谢研究成果及发表的学术论文作者和导师简介附件
相关论文文献
标签:可拓分类知识论文; 综合关联函数论文; 值域覆盖论文; 区间映射论文; 可拓变换论文; 可拓集合论文;