论文摘要
稽核部门是商业银行中的一个重要部门,主要负责银行内部的审计工作。非现场稽核主要以业务源数据为基础,通过数据处理子系统得到稽核应用的衍生数据,利用这些衍生数据,对各种业务的合规性进行稽核审计。业务源数据是稽核系统的灵魂,业务源数据的准确与完整是成功完成稽核任务的基础。数据处理子系统根据业务源数据加工成稽核系统需要的各种指标值,在稽核系统中具有极端重要的作用。 数据处理子系统从企业数据仓库中获取业务源数据,通过ETL(Extract Transform Load)程序将数据传输到稽核系统,在传输过程中,ETL程序负责对源数据进行清洗和转换,以满足稽核系统后续指标计算的需要。数据进入稽核系统后,由数据处理子系统负责完成各种指标值的计算。 本文以某商业银行非现场稽核系统为平台,研究了基于元数据的数据处理子系统的设计与实现方法。系统充分利用了元数据的优势,在ETL过程中以元数据为基础,完成了数据导入脚本的自动生产、任务的自动调度等工作。基于性能的考虑,在设计系统架构时加入了ODS(operational data store)中间层,ETL模块首先将需要的数据由数据仓库传输到ODS,在ODS中对数据进行整理,然后将整理后的数据传输到稽核系统。根据稽核业务的需要,稽核系统中定义了许多指标项,这些指标项的计算方法以元数据的形式存储在表中,系统根据业务源数据计算出各种指标值,为系统的预警、监控、统计等功能提供了数据保证。 稽核系统是基于数据仓库的应用,涉及到的数据量十分庞大,大数据量对数据处理子系统的性能造成了不利影响,性能优化工作势在必行。本文从几个方面对性能优化工作进行了简单介绍,实践证明,这几种优化方法取得了较好的效果。