论文摘要
数据仓库技术是信息领域近年来出现并迅速发展的一种计算机技术,它可以对原始的操作性数据进行各种处理,转换成有用的信息,并充分利用这些信息,辅助企业的决策。随着业务的增长,各类信息系统的使用,企业积累了大量的业务数据,如何利用现有数据为企业创造价值成为企业关注的重点,这种需求在大型跨国企业中尤为突出。因此,在企业中构建数据仓库平台,挖掘其中蕴含的信息,进行信息分析和决策支持成为了企业信息化管理的重要步骤,数据仓库在企业中的应用将迅速增长。本文首先系统地介绍了数据仓库技术的基本概念、数据仓库体系结构、联机分析处理以及数据挖掘的基础知识。接着从国内外数据仓库应用的情况和特点出发,结合通用电器公司消费品与工业品集团(GECI)的实际情况,提出了建设其客户服务部门数据仓库的策略、步骤与方法。然后利用来自于Siebel CallCenter和QAD系统中的真实数据,运用SQL Server 2000建立一个模拟的数据仓库实例。我们按照概念模式、逻辑模式、物理模式的顺序进行设计,在深入理解GECI客户服务部门业务的基础上,充分了解部门需求,设计出数据仓库的数据模型,经过大量的ETL,工作后完成了这个数据仓库系统的开发。在建立部门数据仓库的基础上,对其进行OLAP应用和数据挖掘方面的应用。其中深入研究了决策树算法,并详细地解释了微软决策树,验证了算法的正确性,利用Analysis Services构建一些决策树,结合GECI的实际情况进行分析,提出了对于企业绩效改进的一些可行措施。最后,我们对建立的数据仓库模型进行了评价,从管理决策、商务过程和效率提高等方面阐述了数据仓库对企业带来的影响,并指出其设计的不足之处。
论文目录
摘要ABSTRACT第1章 绪论1.1 论文选题背景1.2 论文主要工作1.3 论文组织第2章 数据仓库与数据挖掘技术2.1 数据仓库2.1.1 数据仓库的概念2.1.2 数据仓库的特征2.1.3 数据仓库与传统数据库的区别2.1.4 数据集市2.1.5 数据仓库的体系结构2.1.6 数据仓库的发展阶段2.2 联机分析处理(OLAP)技术介绍2.2.1 OLAP的特点2.2.2 OLAP的多维数据概念2.2.3 OLAP的多维数据结构2.2.4 OLAP的多维分析操作2.2.5 OLAP的实现方法2.3 数据挖掘基本介绍2.3.1 数据挖掘的概念2.3.2 数据挖掘的目标与流程2.3.3 数据挖掘与数据仓库的关系2.3.4 数据挖掘的应用第3章 GECI数据仓库的规划与需求3.1 企业及部门流程介绍3.1.1 企业部门介绍3.1.2 流程分析3.2 需求分析3.2.1 确定主题3.2.2 把握数据仓库与数据集市的关系3.3 总体结构与开发策略3.3.1 总体结构3.3.2 开发策略的选择第四章 CECI数据仓库的设计与开发4.1 数据仓库概念模式设计4.1.1 E-R模型4.1.2 主题分析4.1.3 数据仓库基本表4.1.4 数据结构概图4.2 数据仓库逻辑模式设计4.2.1 粒度划分4.2.2 数据分割策略4.2.3 关系模式定义4.2.4 基本表的设计4.3 数据仓库物理模式设计4.3.1 设计的规范化4.3.2 确定数据结构的类型4.3.3 确定索引策略4.3.4 提高数据存储效率4.3.5 数据仓库框架的生成4.4 数据的抽取、转换、装载(ETL)4.4.1 ETL的基本介绍4.4.2 ETL的过程4.4.3 具体实现第5章 GECI数据仓库的应用5.1 OLAP的应用5.1.1 多维数据集的建立5.1.2 多维数据的浏览5.1.3 客户端的界面实现5.2 数据挖掘的应用5.2.1 决策树算法介绍5.2.2 算法原理5.2.3 算法验证5.2.4 算法应用第6章 GECI数据仓库的评价6.1 数据仓库应用的优势6.1.1 管理决策6.1.2 商务过程6.1.3 效率提高6.2 数据仓库设计的不足第7章 小结与展望7.1 论文开展的研究工作及成果7.1.1 本文主要的研究工作7.1.2 本文主要的研究成果7.2 论文需要改进的地方致谢参考文献附录A GECI数据仓库表名个人简历 在读期间发表的学术论文与研究成果
相关论文文献
标签:数据仓库论文; 数据集市论文; 数据挖掘论文; 联机分析处理论文; 决策树论文;
基于数据挖掘的企业应用—数据仓库在客服部门的研究与实现
下载Doc文档