论文摘要
作为一种新的数据分析工具,数据挖掘的发展十分迅速。各种类型的数据集都可以作为数据挖掘的对象。面对现今越来越多的数据源和越来越大的数据量,数据挖掘能够有效地从中获取有价值的信息,并可以使人们更好地预测未来可能出现的数据信息,从而提高工作效率。随着挖掘算法研究的日益成熟,对数据挖掘应用的研究自然成为当前的新兴热点。然而当前对数据挖掘应用的研究大部分集中在整体的框架设计及基于新技术的数据挖掘应用上,而几乎没有探讨独立组件的设计方式。本文在对数据挖掘的一般过程及相关算法进行分析的基础上,提出了一种基于J2EE组件技术的通用的数据挖掘系统框架。在此框架各模块对应组件的设计思路上,提出了一种扩展性更好、耦合度更低的设计方式。文中借鉴并扩展了SPSS Clementine中节点的设计形式,并对挖掘过程进行了有效的分解与重组,从而将整个过程良好地节点化。在挖掘流程的表达上,通过使用XML组合若干挖掘节点为节点链的方式有效地降低了系统的耦合性,并在此基础上提出了基于挖掘主题的组织方式。最后,文中还较深入地研究了数据挖掘中经验和知识的复用,并提出了几种逐次过渡的复用方式。
论文目录
摘要ABSTRACT第一章 绪论1.1 选题背景及研究意义1.2 本文的内容及组织结构第二章 数据挖掘技术2.1 数据挖掘技术基础2.1.1 数据挖掘的一般流程2.1.2 数据挖掘的研究内容2.1.3 KDD 处理过程模型2.2 数据挖掘的常用算法2.2.1 分类分析2.2.2 聚类分析2.3 各类算法的共同特征第三章 基于J2EE 的数据挖掘体系框架3.1 J2EE 组件机制介绍3.1.1 组件的概念3.1.2 组件技术的特点3.1.3 JavaBeans 组件技术3.2 挖掘过程的组件化3.2.1 组件的设计思路3.2.2 数据抽取组件3.2.3 数据预处理组件3.2.4 数据建模组件3.2.5 模型评估组件3.2.6 可视化组件3.3 基于J2EE 的数据挖掘体系框架3.3.1 数据抽取模块3.3.2 进程管理模块3.3.3 界面交互模块3.3.4 数据挖掘模块3.3.5 处理流控制模块3.3.6 方案管理模块第四章 组件模块中的节点设计方法4.1 节点介绍4.1.1 节点定义4.1.2 节点的特征4.2 挖掘过程的节点化4.2.1 将挖掘过程节点化4.2.2 其他相关节点4.2.3 节点化的优势4.3 节点间的通信4.4 节点的配置4.4.1 XML 概述4.4.2 节点的一般XML 描述4.4.3 一种延伸的配置方式4.5 节点的定制性4.6 超级节点4.6.1 超级节点的提出4.6.2 超级节点的优点4.6.3 超级节点的类型与规定4.6.4 超级节点的存储第五章 使用节点链定义挖掘过程5.1 节点链介绍5.1.1 节点链定义5.1.2 节点链的XML 表示5.2 挖掘主题的XML 表示5.2.1 两种一般的XML 表示方式5.2.2 两种方式的比较5.2.3 一种改进的方式5.2.4 改进方式的示例5.3 数据挖掘链5.3.1 使用数据挖掘链5.3.2 数据挖掘链模板5.3.3 模板的XML 存储5.3.4 模板复用的过渡方式5.4 分类建模实例第六章 总结与展望6.1 总结6.2 展望参考文献附录致谢
相关论文文献
标签:数据挖掘论文; 节点论文; 节点链论文; 组件论文;