多关系决策树分类算法的研究

多关系决策树分类算法的研究

论文摘要

多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一,高效性一直是该领域的研究重点。对于多关系数据挖掘算法而言,挖掘任务的复杂性对算法性能提出了更高的要求,搜索空间比单一关系模式下变得更大更复杂,提高算法效率的主要瓶颈在于假设空间。针对多关系数据挖掘算法存在的这些问题,本文提出了改进的多关系决策树算法MRDTL-2。本文对数据挖掘理论、多关系数据挖掘理论进行了深入的研究,尤其是多关系决策树分类算法及多关系数据挖掘的最新技术-元组传播技术。本文提出了改进的多关系数据挖掘算法MRDTL-2,提高了算法的效率和用户的满意程度。改进算法的实现过程是在用户指导下完成的,主要是在以下两方面进行改进:第一,在用户指导情况,当数据项小于属性传递阀值时,将元组传播技术应用到多关系决策树算法中。第二,在用户指导情况,当数据项大于传递阀值时,设置空关系Ra,将背景关系中的主关键字、背景属性及目标关系中的类标号传递到中Ra,然后,Ra代替背景关系参与其它多关系决策树。最后,本文对改进的多关系决策树算法MRDTL-2进行了理论证明和实验验证。本文使用PKDD’99中的Financial数据集对改进的多关系决策树算法MRDTL-2进行实验。通过十次交叉迭代验证法,对改进的多关系决策树算法MRDTL-2与MRDTL进行效率对比验证。实验结果表明,本文提出的算法优于现有的同类算法,实现了预期的研究目标。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题的研究背景
  • 1.2 国内外研究情况综述
  • 1.3 本文主要研究内容及论文的组织结构
  • 1.3.1 本文的主要内容
  • 1.3.2 本文的结构安排
  • 第二章 基础知识概述
  • 2.1 数据挖掘概述
  • 2.2 数据挖掘的特点
  • 2.3 数据挖掘的知识模式
  • 2.4 数据挖掘的过程
  • 2.5 多关系数据挖掘的主要技术
  • 2.5.1 关联规则(Association Rules)挖掘
  • 2.5.2 归纳逻辑程序设计
  • 2.5.3 统计关系学习
  • 2.5.4 基于贝叶斯的方法
  • 2.5.5 多关系决策树
  • 本章小结
  • 第三章 多关系决策树算法MRDTL
  • 3.1 关系数据的表示形式
  • 3.1.1 关系数据库的表示
  • 3.1.2 一阶逻辑的表示
  • 3.1.3 基于图的表示
  • 3.2 关系术语
  • 3.3 多关系数据挖掘框架
  • 3.3.1 选择图
  • 3.3.2 选择图的优化
  • 3.4 多关系决策树算法MRDTL
  • 本章小结
  • 第四章 改进的多关系决策树算法MRDTL-2
  • 4.1 引言
  • 4.2 MRDTL-2算法思想
  • 4.3 元组标识传播技术
  • 4.3.1 元组传播技术的基本思想
  • 4.3.2 元组传播技术基本理论
  • 4.4 MRDTL-2的数据预处理
  • 4.4.1 删除噪音
  • 4.4.2 填充缺失值
  • 4.5 MRDTL-2算法实现过程
  • 4.5.1 基本理论
  • 4.5.2 MRDTL-2算法实现
  • 4.5.3 MRDTL-2算法理论证明
  • 4.5.4 MRDTL-2算法实例分析
  • 本章小结
  • 第五章 实验分析
  • 5.1 引言
  • 5.2 实验的运行环境
  • 5.3 实验数据
  • 5.4 实验过程及结果
  • 5.5 实验分析
  • 本章小结
  • 结论
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    多关系决策树分类算法的研究
    下载Doc文档

    猜你喜欢