汽车销售系统数据仓库解决方案

汽车销售系统数据仓库解决方案

论文摘要

目前,国内的数据仓库应用集中在电信、银行、证券等行业领域。在汽车销售行业,数据仓库技术的应用还不是很普及。 本课题针对企业发展的需要,将数据仓库技术应用于汽车销售决策分析系统,力求提供一个可行的解决方案。我们试图完成的这个数据仓库模型,可以分为ETL(数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。),DW(数据仓库),OLAP分析和DM(数据挖掘)等几个部分。 本文首先对企业的业务需求进行了重新探讨,然后对原始数据进行分析,主要是关系型数据库已经不适应企业业务发展的需要,建立数据仓库,并结合OLAP分析技术和数据挖掘技术,从大量的数据中发现有利于企业发展的知识信息,同时保证对业务数据的便捷访问和以更快更好的方式回答复杂的问题。 需求分析已经确定了用户业务分析所需要的数据。模型设计阶段将确定数据仓库系统将来的蓝图。该阶段的主要任务是进行数据仓库的逻辑设计,包括选择合适的主题,确定事实表、相关的维、属性和粒度划分,设计正确的表结构和主键、外键关系等。模型设计主要包括四个基本步骤:确定合适的主题、划分粒度层次、设计维表和设计事实表、数据量的估算等。 数据预处理,也是建设数据仓库不可或缺的步骤之一。在数据抽取、清洗、转载过程中,数据质量问题凸现出来。对数据进行检验和整理,确保数据仓库中数据的一致性,还要对部分数据进行聚集操作,提高数据仓库的查询、分析速度,这些完整的、一致的、细节的和综合的数据才可进入数据仓库。本文就数据质量问题的要素、分类进行了阐述,举例说明了在本课题原始数据中的数据质量方面存在的问题。分析、比较了常用的数据清洗算法,并且就数据库中重复记录的问题,针对排序邻居算法的缺点,在聚类分析算法中,采用Canopy山东口丈学不页创匕学位勃仑文技术,减少了清洗过程中计算量,降低了算法的复杂度。 论文还结合汽车销售决策系统比较分析了数据仓库中的常用的几种数据存储结构。利用Analysis Serviees 2000的多维查询语言MDX做了查询,进行简单地OLAP分析。最后是对本课题的总结,并展望今后的工作方向。关键字:维度建模数据清洗聚类分析OLAP

论文目录

  • 目录
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题背景及研究对象
  • 1.2 国内外研究现状
  • 1.3 本课题研究的意义
  • 1.4 论文研究的主要内容
  • 第二章 汽车销售系统数据仓库解决方案
  • 2.1 数据仓库源系统分析
  • 2.2 业务需求重定位
  • 2.3 业务数据
  • 2.4 两种模式的探讨
  • 2.5 决策分析系统的主要设计内容
  • 第三章 维度建模分析
  • 3.1 确定主题
  • 3.2 粒度分析
  • 3.3 维度表的创建
  • 3.3.1 车辆维
  • 3.3.2 地区维
  • 3.3.3 日期维度
  • 3.3.4 产品维度
  • 3.3.5 促销维度
  • 3.3.6 客户维度
  • 3.3 事实表:建立数据中心
  • 3.3.1 销售事实表
  • 3.3.2 订单事实表
  • 3.3.3 促销范围事实表
  • 第四章 数据预处理
  • 4.1 数据质量问题
  • 4.2 数据清洗技术的现状
  • 4.3 清洗过程的六个步骤
  • 4.4 数据清洗算法分析
  • 4.5 基于聚类分析的数据清洗算法的改进
  • 4.5.1 聚类分析的方法定义
  • 4.5.2 关于复制记录的检测
  • 4.5.3 运用Canopy技术减少计算量
  • 4.5.4 算法描述
  • 4.6 数据分割
  • 第五章 利用Analysis Services 2000实现数据仓库和OLAP分析
  • 5.1 数据仓库的实现
  • 5.2 多维查询语言 MDX
  • 5.3 对多维数据的访问
  • 第六章 总结与展望
  • 6.1 可能存在的问题
  • 6.2 本文主要贡献
  • 致谢
  • 参考文献
  • 攻读学位期间发表的论文情况
  • 相关论文文献

    • [1].数据仓库技术在高速公路数据仓库系统中的应用[J]. 吉林交通科技 2011(01)
    • [2].基于微软数据仓库的农业科技支撑数据应用分析与展望[J]. 农业展望 2019(12)
    • [3].计算机数据仓库的构建原理及发展趋势[J]. 延边教育学院学报 2018(06)
    • [4].七大云计算数据仓库[J]. 计算机与网络 2019(20)
    • [5].基于网络数据仓库及OLAP技术的决策支持系统设计[J]. 网络安全技术与应用 2015(11)
    • [6].大数据环境下动态数据仓库的应用研究[J]. 电子技术与软件工程 2015(02)
    • [7].维数据仓库及其在复杂数据建模中的应用研究[J]. 通讯世界 2015(03)
    • [8].使用数据清洗技术进行中医药数据仓库质量控制研究[J]. 中国数字医学 2012(04)
    • [9].数据仓库构建之行为模式分析[J]. 信息系统学报 2013(01)
    • [10].采用云计算技术构建大型数据仓库平台的解析[J]. 计算机光盘软件与应用 2013(22)
    • [11].再谈数据仓库[J]. 软件和信息服务 2013(02)
    • [12].数据仓库突破者[J]. 软件和信息服务 2010(04)
    • [13].基于SQL Server 2005构建数据仓库的探索[J]. 新课程(教育学术) 2012(01)
    • [14].重塑传统,打造第四代数据仓库[J]. 软件和集成电路 2019(01)
    • [15].基于数据仓库的数据血缘管理研究[J]. 轻工科技 2019(04)
    • [16].数据仓库在区域健康管理大数据平台构建中的应用[J]. 中国卫生信息管理杂志 2019(03)
    • [17].水质监测实验室信息管理系统中数据仓库的运用[J]. 信息系统工程 2019(07)
    • [18].测量数据仓库的概念研究[J]. 遥测遥控 2018(01)
    • [19].生态应急决策支持数据仓库战略设计与实施研究[J]. 镇江高专学报 2018(01)
    • [20].云环境下的分层数据仓库架构及其服务研究[J]. 现代信息科技 2018(01)
    • [21].医院信息化建设中数据仓库技术的应用[J]. 信息与电脑(理论版) 2018(22)
    • [22].基于大数据平台构建数据仓库的研究与实践[J]. 中国金融电脑 2017(05)
    • [23].面向大型装备状态分析的分布式实时数据仓库构建技术[J]. 计算机集成制造系统 2017(10)
    • [24].基于数据仓库和数据采集的高校教学管理决策支持系统研究[J]. 佳木斯职业学院学报 2015(12)
    • [25].农信数据仓库的建设路径[J]. 中国农村金融 2015(02)
    • [26].数据仓库与数据技术的研究与应用[J]. 信息与电脑(理论版) 2014(24)
    • [27].数据仓库可以帮助医疗保健机构达到有效使用[J]. 中国数字医学 2011(07)
    • [28].关于数据库技术与数据仓库的思考[J]. 数字技术与应用 2015(09)
    • [29].浅析地质数据仓库的特点及数据组织[J]. 科学中国人 2016(17)
    • [30].浅析数据仓库与数据挖掘的应用[J]. 内江科技 2014(01)

    标签:;  ;  ;  

    汽车销售系统数据仓库解决方案
    下载Doc文档

    猜你喜欢