论文摘要
经过多年的金融电子化建设,银行积累了大量的反映银行经营管理活动的数据,然而,由于早期的信息化建设是个逐步摸索的过程,缺乏统一的规划和信息标准,导致了在大多数银行的数据存储中出现了没有统一的数据源、数据孤岛、数据不一致、数据质量不高、安全性低等问题阻碍了银行经营管理的智能分析,本课题的研究正是基于目前银行数据存储的弊端,着重研究了ODS系统在银行业中的应用。本文在充分理解数据仓库和操作型数据存储(Operational Data Store,ODS)的理论基础上,对数据仓库和ODS做以比较,凸显ODS的作用和优势,针对银行业的现状,给出了在原有DB-DW的体系结构中,加入ODS,从而形成了DB-ODS-DW的三层体系结构。根据银行业的案例,本文给出了银行业中利用ODS处理数据的的总体架构、数据存储方案,以及在实现过程中起到关键作用的ETL架构设计,分析了数据存储过程中的数据质量控制,并在最后探讨了系统扩展性设计问题。
论文目录
摘要ABSTRACT第1章 引言1.1 研究背景和现状分析1.2 课题研究内容和目标1.3 本文的安排第2章 ODS技术概述2.1 数据仓库的产生及在行业中的应用2.1.1 数据仓库的产生2.1.2 数据仓库在银行业中的应用2.2 操作型数据存储(ODS)的产生2.3 ODS的概念和特点2.4 ODS的体系结构与作用2.5 ODS与数据仓库的比较2.6 其它相关概念2.6.1 ETL2.6.2 数据集市2.6.3 DataStage2.7 本章小结第3章 系统分析与总体设计3.1 行业应用背景3.2 功能分析3.2.1 功能性目标3.2.2 非功能性目标3.3 系统总体架构设计3.3.1 逻辑架构3.3.2 物理架构3.4 ODS运行引擎组成模块说明3.5 配置清单3.6 本章小结第4章 数据存储方案4.1 数据量分析4.2 ODS数据存储结构4.3 物理表的结构4.4 本章小结第5章 ETL架构5.1 ETL架构设计应具有的特性5.1.1 高效性5.1.2 可扩展性5.1.3 灵活性5.1.4 可迁移性5.1.5 可恢复性5.2 标准ETL过程的设计5.2.1 源系统卸数过程5.2.2 数据标准化过程5.2.3 数据模型化过程5.2.4 汇总计算过程5.2.5 数据提交过程5.3 数据周期的管理5.3.1 Cycle调度策略5.3.2 业务日期的切换5.4 本章小结第6章 数据质量控制6.1 数据物理核验6.1.1 物理核验的范围6.1.2 数据检核结果的控制6.1.3 数据质量提高的机制6.2 数据业务检核6.3 本章小结第7章 性能和扩展性设计7.1 性能的考虑7.1.1 数据存储和访问7.1.2 ETL过程7.2 扩展性第8章 结论与展望致谢参考文献个人简历 在读期间发表的学术论文与研究成果
相关论文文献
标签:数据存储论文; 数据集市论文;