基于元数据的稽核系统中数据处理子系统设计与实现

基于元数据的稽核系统中数据处理子系统设计与实现

论文摘要

稽核部门是商业银行中的一个重要部门,主要负责银行内部的审计工作。非现场稽核主要以业务源数据为基础,通过数据处理子系统得到稽核应用的衍生数据,利用这些衍生数据,对各种业务的合规性进行稽核审计。业务源数据是稽核系统的灵魂,业务源数据的准确与完整是成功完成稽核任务的基础。数据处理子系统根据业务源数据加工成稽核系统需要的各种指标值,在稽核系统中具有极端重要的作用。 数据处理子系统从企业数据仓库中获取业务源数据,通过ETL(Extract Transform Load)程序将数据传输到稽核系统,在传输过程中,ETL程序负责对源数据进行清洗和转换,以满足稽核系统后续指标计算的需要。数据进入稽核系统后,由数据处理子系统负责完成各种指标值的计算。 本文以某商业银行非现场稽核系统为平台,研究了基于元数据的数据处理子系统的设计与实现方法。系统充分利用了元数据的优势,在ETL过程中以元数据为基础,完成了数据导入脚本的自动生产、任务的自动调度等工作。基于性能的考虑,在设计系统架构时加入了ODS(operational data store)中间层,ETL模块首先将需要的数据由数据仓库传输到ODS,在ODS中对数据进行整理,然后将整理后的数据传输到稽核系统。根据稽核业务的需要,稽核系统中定义了许多指标项,这些指标项的计算方法以元数据的形式存储在表中,系统根据业务源数据计算出各种指标值,为系统的预警、监控、统计等功能提供了数据保证。 稽核系统是基于数据仓库的应用,涉及到的数据量十分庞大,大数据量对数据处理子系统的性能造成了不利影响,性能优化工作势在必行。本文从几个方面对性能优化工作进行了简单介绍,实践证明,这几种优化方法取得了较好的效果。

论文目录

  • 第1章 绪论
  • 1.1.研究背景介绍
  • 1.2.金融稽核系统背景
  • 1.3.本文研究内容
  • 1.4.论文结构
  • 第2章 相关技术综述
  • 2.1.数据仓库
  • 2.1.1.数据仓库定义
  • 2.1.2.数据集市
  • 2.2.数据仓库元数据
  • 2.2.1.元数据分类
  • 2.2.2.ETL相关元数据
  • 2.2.3.元数据的作用
  • 2.3.ETL概述
  • 2.3.1.数据抽取
  • 2.3.2.数据转换
  • 2.3.3.数据装载
  • 2.4.国内ETL技术的现状
  • 2.5.ETL实现方式比较
  • 2.6.数据清洗
  • 第3章 系统设计
  • 3.1.设计概述
  • 3.2.EDW→ODS设计
  • 3.2.1.ETL工具的必要性
  • 3.2.2.技术方案
  • 3.2.2.1 数据抽取
  • 3.2.2.2 数据转换
  • 3.2.2.3 数据装载
  • 3.3.ODS→稽核系统设计
  • 3.4.数据计算设计
  • 3.4.1.定时计算Server设计
  • 3.4.2.即时计算Server设计
  • 3.4.3.元数据设计
  • 3.4.3.1 技术元数据
  • 3.4.3.2 业务元数据
  • 第4章 系统实现
  • 4.1.EDW→ODS实现
  • 4.1.1.具体工作任务
  • 4.1.2.项目技术关键
  • 4.1.2.1 业务技术规则
  • 4.1.2.2 流程控制
  • 4.1.2.3 数据的装载策略
  • 4.1.2.4 系统自动运行控制
  • 4.1.2.5 元数据的使用
  • 4.2.ODS→稽核系统实现
  • 4.2.1.具体工作任务
  • 4.2.1.1 ODS数据整理
  • 4.2.1.2 ODS到稽核系统的导数
  • 4.2.2.ETL性能优化
  • 4.2.2.1 ETL架构优化
  • 4.2.2.2 RDBMS(Oracle)优化
  • 4.2.2.3 SQL语句优化
  • 4.3.数据处理实现
  • 4.3.1.定时计算
  • 4.3.2.即时计算
  • 第5章 结束语
  • 参考文献
  • 致谢
  • 相关论文文献

    标签:;  ;  

    基于元数据的稽核系统中数据处理子系统设计与实现
    下载Doc文档

    猜你喜欢