论文摘要
近年来,数据仓库技术被国内外企业越来越多人关注,而且随着市场的进一步开放以及商业竞争的加剧,企业对市场分析、运作状态的监控和评估的要求越来越高,将会有更多的企业建设数据仓库系统。如何有效地实施数据仓库系统建设,以满足企业各种灵活、多样的分析统计要求,是数据仓库项目实施所关注的一个重要问题。论文通过一个机场管理数据仓库系统的建设过程,分析了数据仓库的应用背景,对数据仓库的基本技术思想进行了综述,针对该行业的特点,对机场数据仓库建设需求分析作了调研,提出了一些构建数据仓库过程的方法。根据机场管理数据仓库的需求,结合将来可能的变更,以航班飞行的数据集市为例子,构建了航班飞行数据集市,分析了机场运营情况,各航空公司在同一航线的收益情况,及各航空公司在本机场的运营情况等。数据集市的建模是在带有ODS (Operational Data Store)的数据仓库体系结构中完成的,数据仓库建模的方式是采用星型模式,对原有的航班飞行数据进行了验证、清洗、抽取,抽取的数据存储于ODS表,采用ODS方式的好处是方便多数据源汇总后进行一致性和完整性校验后动态加载到事实表和维度表,保证了加载到事实表和维度表里面的数据的准确性,数据抽取是采用ETL (pdi-open-3.1.0-826)工具,动态加载是通过存储过程编程实现,立方体建模是采用schema workbench工具,展示工具采用Mondrian (OLAP引擎),通过对Mondrian进行二次开发展现前端,将schema workbench工具生成的xml文件加载到展现前端,展现前端通过加载的xml规则动态取得后台数据库事实表和维度表的数据展现出动态的丰富的报表和图表内容。本文所研究的内容对数据仓库建设和实现有普遍意义,是一般的数据仓库解决方法,对企业构建数据仓库具有一定的应用价值。