决策树算法研究及其在城建档案收集管理中的应用

决策树算法研究及其在城建档案收集管理中的应用

论文摘要

数字城建档案馆作为未来城建档案馆的发展趋势,必然会积累越来越多的数字档案信息。随着数据挖掘技术的飞速发展,越来越多的研究人员将数据挖掘技术和城建档案管理结合起来进行探讨和研究。针对目前城建档案收集工作出现的盲目和被动问题,本文提出一种应用雨林框架思想的改进C4.5算法,并将此算法应用于城建档案馆的档案收集工作,取得了令人满意的效果。本文主要内容如下:首先,研究了决策树各种典型算法,对不同决策树算法的优缺点进行了分析和比较,最终选择具有能够处理连续值数据和具有简单树结构的C4.5算法。其次,针对传统C4.5算法可伸缩性差的缺点,应用雨林框架对其进行了改进。并且从天气数据实例和理论证明两个方面对传统C4.5算法和改进C4.5算法的内存占用量进行了比较和分析。最后,将改进的C4.5算法应用到城建档案收集管理业务中,按照软件工程的开发流程和面向对象的思想设计城建档案收集管理系统,并应用Hibernate、SWT/JFace等技术进行实现。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1-1 城建档案收集管理的背景与意义
  • 1-1-1 城建档案管理的数字化背景
  • 1-1-2 城建档案收集问题的研究意义
  • 1-1-3 城建档案收集问题的研究现状
  • 1-2 数据挖掘与决策树的研究背景与应用现状
  • 1-2-1 数据挖掘技术研究背景
  • 1-2-2 决策树算法研究现状
  • 1-2-3 数据挖掘技术在档案管理中的应用现状
  • 1-3 论文的主要研究内容
  • 第二章 决策树算法研究
  • 2-1 数据挖掘理论与技术
  • 2-2 决策树算法
  • 2-2-1 决策树算法描述
  • 2-2-2 决策树算法特点
  • 2-2-3 决策树适用问题
  • 2-3 典型决策树算法研究
  • 2-3-1 ID3 算法
  • 2-3-2 C4.5 算法
  • 2-3-3 CART 算法
  • 2-3-4 SLIQ 算法
  • 2-3-5 SPRINT 算法
  • 2-4 决策树算法比较分析
  • 第三章 C4.5 算法改进设计
  • 3-1 雨林框架
  • 3-2 基于雨林框架的C4.5 算法改进设计
  • 3-2-1 决策树构建流程
  • 3-2-2 面向对象设计算法类图
  • 3-3 算法性能分析
  • 3-3-1 传统C4.5 算法分析
  • 3-3-2 改进C4.5 算法分析
  • 3-3-3 总结
  • 第四章 C4.5 算法在城建档案收集管理中的应用
  • 4-1 数据预处理
  • 4-1-1 属性选择
  • 4-1-2 数据清理
  • 4-1-3 数据规约
  • 4-2 算法正确率验证方案
  • 4-3 决策树与逻辑规则
  • 4-4 城建档案收集知识获取
  • 第五章 城建档案收集管理系统设计
  • 5-1 城建档案收集管理业务描述
  • 5-2 系统总体设计
  • 5-3 决策树算法模块设计
  • 5-3-1 决策树构建
  • 5-3-2 分类预测
  • 5-3-3 算法数据库更新
  • 5-4 数据库持久层设计
  • 第六章 结论
  • 6-1 本文总结
  • 6-2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间所取得的相关科研成果
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    决策树算法研究及其在城建档案收集管理中的应用
    下载Doc文档

    猜你喜欢