基于XML的数据源模型研究与应用
论文摘要
数据源是数据挖掘应用的关键,目前数据预处理技术已相当成熟。数据库技术的不断发展使得在建立数据源时必须面对异构数据库问题。综合运用数据转换技术和数据预处理技术解决在异构数据库环境中建立数据源问题成为论文的研究重点。本文围绕在异构数据库环境中建立数据挖掘数据源问题,提出了在异构数据库中基于XML技术的数据源模型。在模型中把数据源建立分为两个部分:数据转换和数据预处理,定义了模型中对数据源设置的操作集,并在模型中集成数据库连接技术、XSLT处理技术、组件技术和数据预处理技术。以此模型为基础实现了Notes文档数据到关系数据库的数据转换,生成基于群件的数据挖掘的数据源及基于该数据源运用微软聚类方法进行简单分析。
论文目录
提要ABSTRACT第1章 绪论1.1 群件1.1.1 群件的定义1.1.2 群件的优势1.2 工作流1.2.1 工作流的定义1.2.2 工作流的过程定义1.2.3 Petri 网与工作流建模1.2.4 工作流优势1.3 办公自动化系统1.3.1 办公自动化的定义1.3.2 办公自动化系统的层次1.3.3 办公自动化系统的应用1.3.4 办公自动化系统产生的数据分类1.4 数据挖掘1.4.1 数据挖掘现状1.4.2 数据挖掘的定义1.4.3 数据挖掘能做什么1.4.4 数据挖掘的过程1.4.5 数据挖掘的应用分类1.4.6 数据挖掘的方法第2章 数据源建立的相关问题2.1 数据的预处理2.1.1 数据清理2.1.2 数据集成2.1.3 数据变换2.1.4 数据归约2.2 异构数据库2.2.1 异构数据库的异构性2.2.2 异构数据库比较实例2.2.3 异构数据库的数据转换目标2.2.4 异构数据库的数据转换2.3 运用XML 实现异构数据库的数据转换2.4 数据源的建立过程2.4.1 数据转换2.4.2 数据预处理第3章 数据源模型3.1 数据源模型的相关工具3.1.1 XML3.1.2 XSLT3.1.3 DTD3.1.4 XML Schema3.2 数据源模型定义3.2.1 数据源属性3.2.2 数据输入3.2.3 数据处理3.2.4 数据输出3.2.5 数据源的格式定义3.2.6 数据源的管理第4章 实例研究4.1 流转记录库的设计4.1.1 流转记录的产生4.1.2 流转记录的结构4.1.3 流转记录库的功能4.2 数据源的建立过程4.3 Domino 对 XML 的支持方式4.3.1 XML 的使用方法4.3.2 XML 的处理工具4.4 数据转换的同步4.4.1 COM4.4.2 Domino 对COM 的支持4.5 数据源的格式描述4.6 数据源的格式转换4.7 运用OPEN XML 将数据保存到关系数据库4.7.1 数据库表的设计4.8 基于数据源生成催办模型4.8.1 SQL Server 2000 对数据挖掘功能的支持4.8.2 运用微软聚类进行数据挖掘结论参考文献表摘要英文摘要致谢
相关论文文献
本文来源: https://www.lw50.cn/article/9f1cf4fc8adb7c8823a2105e.html