数据挖掘决策树分类算法的研究与应用

数据挖掘决策树分类算法的研究与应用

论文摘要

本篇论文基于实际项目《疾病防控与儿童免疫管理系统》的开发,从实际应用出发,系统地研究了数据挖掘决策树分类算法的理论,提出现有算法的不足之处,针对ID3算法的取值偏向问题以及在实际应用中所带来的误差,对算法在实际应用中进行了改进,将理论应用到实际的项目系统当中,深入浅出地解释算法,并在其上进行决策支持系统的开发。实现了决策支持模块,成为系统的一个智能化子模块。从软件开发技术的发展来看,随着Internet技术的兴起,应用软件系统的体系结构开始由C/S(客户机/服务器)结构向B/S(浏览器朋艮务器)结构过渡,本系统就是基于B/S架构、J2EE技术,采用了商务智能技术、便携式接种机技术,成功地解决了数据分散集中问题、异地接种同步性问题、应种难以统计、儿童流动建卡管理、农村接种问题、“笔下接种”、“虚假接种率”问题。本文不仅在理论上对几种常用的决策树分类算法进行了探讨和比较分析,而且将其应用到实际项目中,实现了系统的设计开发及其应用价值,为决策树分类算法开辟了新的应用领域。决策支持子模块还处在开发试用阶段,还需要在应用中进一步完善,提高系统的实用价值。

论文目录

  • 内容提要
  • 第1章 绪论
  • 1.1 研究的背景与意义
  • 1.2 国内外研究现状
  • 1.3 课题主要研究内容和成果
  • 1.4 本文组织结构
  • 第2章 数据挖掘理论与分类方法研究
  • 2.1 数据挖掘的概念
  • 2.2 数据挖掘的主要任务和方法
  • 2.3 数据挖掘工具的评价标准
  • 2.4 数据挖掘中的分类方法概述
  • 2.5 分类的基本技术
  • 2.6 几种典型的分类算法研究
  • 2.6.1 决策树分类算法
  • 2.6.2 遗传算法
  • 2.6.3 神经网络方法
  • 2.6.4 K-最近邻分类算法
  • 2.7 分类技术在疾病防控与儿童免疫系统中的应用举例
  • 2.8 本章小结
  • 第3章 决策树分类算法的研究及实现和改进
  • 3.1 决策树分类算法
  • 3.2 典型的决策树算法
  • 3.2.1 ID3算法
  • 3.2.2 C4.5算法
  • 3.2.3 CART算法
  • 3.2.4 PUBLIC算法
  • 3.2.5 基于人机交互的方法
  • 3.2.6 SLIQ算法
  • 3.2.7 SPRINT算法
  • 3.2.8 IBLE算法
  • 3.3 决策树的构造、简化
  • 3.4 树剪枝算法
  • 3.4.1 前期剪枝
  • 3.4.2 后期剪枝
  • 3.4.3 对树进行修剪优化时应遵循的原则
  • 3.5 对决策树算法的讨论
  • 3.5.1 决策树算法的比较
  • 3.5.2 决策树的优劣
  • 3.6 算法的改进及在实际中的应用
  • 3.6.1 系统涉及的关键技术
  • 3.6.2 算法的具体实现
  • 3.7 本章小结
  • 第4章 决策树分类算法的应用及分析
  • 4.1 疾病防控与儿童免疫管理系统介绍
  • 4.2 系统的体系结构
  • 4.3 疾病防控与儿童免疫管理系统的现状及发展趋势
  • 4.3.1 技术现状
  • 4.3.2 技术发展趋势
  • 4.4 决策支持子系统的开发过程
  • 4.4.1 数据选取和数据预处理
  • 4.4.2 决策树生成
  • 4.4.3 决策规则的产生
  • 4.4.4 决策支持子系统的分析
  • 4.4.5 决策支持子系统的不足及进一步改进工作
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 摘要
  • ABSTRACT
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    数据挖掘决策树分类算法的研究与应用
    下载Doc文档

    猜你喜欢