论文摘要
多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一,高效性一直是该领域的研究重点。对于多关系数据挖掘算法而言,挖掘任务的复杂性对算法性能提出了更高的要求,搜索空间比单一关系模式下变得更大更复杂,提高算法效率的主要瓶颈在于假设空间。针对多关系数据挖掘算法存在的这些问题,本文提出了改进的多关系决策树算法MRDTL-2。本文对数据挖掘理论、多关系数据挖掘理论进行了深入的研究,尤其是多关系决策树分类算法及多关系数据挖掘的最新技术-元组传播技术。本文提出了改进的多关系数据挖掘算法MRDTL-2,提高了算法的效率和用户的满意程度。改进算法的实现过程是在用户指导下完成的,主要是在以下两方面进行改进:第一,在用户指导情况,当数据项小于属性传递阀值时,将元组传播技术应用到多关系决策树算法中。第二,在用户指导情况,当数据项大于传递阀值时,设置空关系Ra,将背景关系中的主关键字、背景属性及目标关系中的类标号传递到中Ra,然后,Ra代替背景关系参与其它多关系决策树。最后,本文对改进的多关系决策树算法MRDTL-2进行了理论证明和实验验证。本文使用PKDD’99中的Financial数据集对改进的多关系决策树算法MRDTL-2进行实验。通过十次交叉迭代验证法,对改进的多关系决策树算法MRDTL-2与MRDTL进行效率对比验证。实验结果表明,本文提出的算法优于现有的同类算法,实现了预期的研究目标。
论文目录
摘要Abstract第一章 绪论1.1 课题的研究背景1.2 国内外研究情况综述1.3 本文主要研究内容及论文的组织结构1.3.1 本文的主要内容1.3.2 本文的结构安排第二章 基础知识概述2.1 数据挖掘概述2.2 数据挖掘的特点2.3 数据挖掘的知识模式2.4 数据挖掘的过程2.5 多关系数据挖掘的主要技术2.5.1 关联规则(Association Rules)挖掘2.5.2 归纳逻辑程序设计2.5.3 统计关系学习2.5.4 基于贝叶斯的方法2.5.5 多关系决策树本章小结第三章 多关系决策树算法MRDTL3.1 关系数据的表示形式3.1.1 关系数据库的表示3.1.2 一阶逻辑的表示3.1.3 基于图的表示3.2 关系术语3.3 多关系数据挖掘框架3.3.1 选择图3.3.2 选择图的优化3.4 多关系决策树算法MRDTL本章小结第四章 改进的多关系决策树算法MRDTL-24.1 引言4.2 MRDTL-2算法思想4.3 元组标识传播技术4.3.1 元组传播技术的基本思想4.3.2 元组传播技术基本理论4.4 MRDTL-2的数据预处理4.4.1 删除噪音4.4.2 填充缺失值4.5 MRDTL-2算法实现过程4.5.1 基本理论4.5.2 MRDTL-2算法实现4.5.3 MRDTL-2算法理论证明4.5.4 MRDTL-2算法实例分析本章小结第五章 实验分析5.1 引言5.2 实验的运行环境5.3 实验数据5.4 实验过程及结果5.5 实验分析本章小结结论致谢参考文献
相关论文文献
标签:数据挖掘论文; 分类论文; 决策树论文; 多关系数据挖掘论文; 元组标识传播论文;