论文摘要
数字城建档案馆作为未来城建档案馆的发展趋势,必然会积累越来越多的数字档案信息。随着数据挖掘技术的飞速发展,越来越多的研究人员将数据挖掘技术和城建档案管理结合起来进行探讨和研究。针对目前城建档案收集工作出现的盲目和被动问题,本文提出一种应用雨林框架思想的改进C4.5算法,并将此算法应用于城建档案馆的档案收集工作,取得了令人满意的效果。本文主要内容如下:首先,研究了决策树各种典型算法,对不同决策树算法的优缺点进行了分析和比较,最终选择具有能够处理连续值数据和具有简单树结构的C4.5算法。其次,针对传统C4.5算法可伸缩性差的缺点,应用雨林框架对其进行了改进。并且从天气数据实例和理论证明两个方面对传统C4.5算法和改进C4.5算法的内存占用量进行了比较和分析。最后,将改进的C4.5算法应用到城建档案收集管理业务中,按照软件工程的开发流程和面向对象的思想设计城建档案收集管理系统,并应用Hibernate、SWT/JFace等技术进行实现。
论文目录
摘要ABSTRACT第一章 绪论1-1 城建档案收集管理的背景与意义1-1-1 城建档案管理的数字化背景1-1-2 城建档案收集问题的研究意义1-1-3 城建档案收集问题的研究现状1-2 数据挖掘与决策树的研究背景与应用现状1-2-1 数据挖掘技术研究背景1-2-2 决策树算法研究现状1-2-3 数据挖掘技术在档案管理中的应用现状1-3 论文的主要研究内容第二章 决策树算法研究2-1 数据挖掘理论与技术2-2 决策树算法2-2-1 决策树算法描述2-2-2 决策树算法特点2-2-3 决策树适用问题2-3 典型决策树算法研究2-3-1 ID3 算法2-3-2 C4.5 算法2-3-3 CART 算法2-3-4 SLIQ 算法2-3-5 SPRINT 算法2-4 决策树算法比较分析第三章 C4.5 算法改进设计3-1 雨林框架3-2 基于雨林框架的C4.5 算法改进设计3-2-1 决策树构建流程3-2-2 面向对象设计算法类图3-3 算法性能分析3-3-1 传统C4.5 算法分析3-3-2 改进C4.5 算法分析3-3-3 总结第四章 C4.5 算法在城建档案收集管理中的应用4-1 数据预处理4-1-1 属性选择4-1-2 数据清理4-1-3 数据规约4-2 算法正确率验证方案4-3 决策树与逻辑规则4-4 城建档案收集知识获取第五章 城建档案收集管理系统设计5-1 城建档案收集管理业务描述5-2 系统总体设计5-3 决策树算法模块设计5-3-1 决策树构建5-3-2 分类预测5-3-3 算法数据库更新5-4 数据库持久层设计第六章 结论6-1 本文总结6-2 展望参考文献致谢攻读学位期间所取得的相关科研成果
相关论文文献
标签:算法论文; 决策树论文; 数据挖掘论文; 雨林框架论文; 城建档案论文;