基于J2EE的数据挖掘框架与节点设计方法

基于J2EE的数据挖掘框架与节点设计方法

论文摘要

作为一种新的数据分析工具,数据挖掘的发展十分迅速。各种类型的数据集都可以作为数据挖掘的对象。面对现今越来越多的数据源和越来越大的数据量,数据挖掘能够有效地从中获取有价值的信息,并可以使人们更好地预测未来可能出现的数据信息,从而提高工作效率。随着挖掘算法研究的日益成熟,对数据挖掘应用的研究自然成为当前的新兴热点。然而当前对数据挖掘应用的研究大部分集中在整体的框架设计及基于新技术的数据挖掘应用上,而几乎没有探讨独立组件的设计方式。本文在对数据挖掘的一般过程及相关算法进行分析的基础上,提出了一种基于J2EE组件技术的通用的数据挖掘系统框架。在此框架各模块对应组件的设计思路上,提出了一种扩展性更好、耦合度更低的设计方式。文中借鉴并扩展了SPSS Clementine中节点的设计形式,并对挖掘过程进行了有效的分解与重组,从而将整个过程良好地节点化。在挖掘流程的表达上,通过使用XML组合若干挖掘节点为节点链的方式有效地降低了系统的耦合性,并在此基础上提出了基于挖掘主题的组织方式。最后,文中还较深入地研究了数据挖掘中经验和知识的复用,并提出了几种逐次过渡的复用方式。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 选题背景及研究意义
  • 1.2 本文的内容及组织结构
  • 第二章 数据挖掘技术
  • 2.1 数据挖掘技术基础
  • 2.1.1 数据挖掘的一般流程
  • 2.1.2 数据挖掘的研究内容
  • 2.1.3 KDD 处理过程模型
  • 2.2 数据挖掘的常用算法
  • 2.2.1 分类分析
  • 2.2.2 聚类分析
  • 2.3 各类算法的共同特征
  • 第三章 基于J2EE 的数据挖掘体系框架
  • 3.1 J2EE 组件机制介绍
  • 3.1.1 组件的概念
  • 3.1.2 组件技术的特点
  • 3.1.3 JavaBeans 组件技术
  • 3.2 挖掘过程的组件化
  • 3.2.1 组件的设计思路
  • 3.2.2 数据抽取组件
  • 3.2.3 数据预处理组件
  • 3.2.4 数据建模组件
  • 3.2.5 模型评估组件
  • 3.2.6 可视化组件
  • 3.3 基于J2EE 的数据挖掘体系框架
  • 3.3.1 数据抽取模块
  • 3.3.2 进程管理模块
  • 3.3.3 界面交互模块
  • 3.3.4 数据挖掘模块
  • 3.3.5 处理流控制模块
  • 3.3.6 方案管理模块
  • 第四章 组件模块中的节点设计方法
  • 4.1 节点介绍
  • 4.1.1 节点定义
  • 4.1.2 节点的特征
  • 4.2 挖掘过程的节点化
  • 4.2.1 将挖掘过程节点化
  • 4.2.2 其他相关节点
  • 4.2.3 节点化的优势
  • 4.3 节点间的通信
  • 4.4 节点的配置
  • 4.4.1 XML 概述
  • 4.4.2 节点的一般XML 描述
  • 4.4.3 一种延伸的配置方式
  • 4.5 节点的定制性
  • 4.6 超级节点
  • 4.6.1 超级节点的提出
  • 4.6.2 超级节点的优点
  • 4.6.3 超级节点的类型与规定
  • 4.6.4 超级节点的存储
  • 第五章 使用节点链定义挖掘过程
  • 5.1 节点链介绍
  • 5.1.1 节点链定义
  • 5.1.2 节点链的XML 表示
  • 5.2 挖掘主题的XML 表示
  • 5.2.1 两种一般的XML 表示方式
  • 5.2.2 两种方式的比较
  • 5.2.3 一种改进的方式
  • 5.2.4 改进方式的示例
  • 5.3 数据挖掘链
  • 5.3.1 使用数据挖掘链
  • 5.3.2 数据挖掘链模板
  • 5.3.3 模板的XML 存储
  • 5.3.4 模板复用的过渡方式
  • 5.4 分类建模实例
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 附录
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于J2EE的数据挖掘框架与节点设计方法
    下载Doc文档

    猜你喜欢