论文摘要
伴随国家信息化建设的快速发展,各种各类数据信息不断涌现,时时刻刻为人们的日常生活生产提供信息服务。Internet的全世界普及,使数据每一时刻都在网络中流动,使数据散落在不同的数据存储系统与设备中。为实现数据在客户端汇聚,G/S模式应运而生。它采用“请求(request)-聚合(Polymerization)-服务(Service)"机制对所有的数据信息服务过程进行组织与管理,在客户端实现数据信息汇聚和服务聚合。G/S模式解决了数据的汇聚问题,但是如何管理各种数据,G/S模式并没有提出有效的解决方法。为了能够更快更好的获取数据,为G/S模式服务,成都理工大学教授苗放老师提出了以数据为中心,以标识为主线的面向数据的体系结构——DOA,运用数据的元数据实现对数据的统一管理。要管理各种类型数据,首先要有相关数据的元数据,所以数据的元数据存储问题,成为了DOA首要考虑的问题。DOA要求数据注册中心能够快速提供数据的元数据信息,如何存储才能快速提供元数据,成为DOA下元数据管理数据的瓶颈,也是本文研究的问题,解决DOA下的数据注册中心元数据快速获取的存储问题,成为当务之急。本文首先对G/S模式和DOA进行了全面概述,分析了它们的层次结构与对数据汇聚和管理的作用,促使了对元数据存储策略的研究。通过对元数据标准和开发设计框架基础知识的概述,为设计了元数据存储规范准备了基础知识。本文的工作如下:(1)研究数据注册中心元数据存储策略由于DOA使用元数据统一管理各种数据,所以元数据的获取速度决定了DOA的性能。因而,如何存储元数据成为元数据快速获取的关键。在分析研究文件系统方式、LDAP目录存储方式、各种关系数据库存储方式和内存数据存储方式的存储优缺点的基础上,对使用何种存储方式才能使数据注册中心元数据被快速获取进行了分析研究。并依据研究成果,设计了一种能够实现元数据快速获取的元数据存储结构模型。(2)研究元数据存储的相关算法基于内存容量的大小和元数据被访问频率的问题,研究为内存提供存储元数据的相关算法。研究了一种基于代价函数的缓存替换算法,为数据注册中心在缓存中动态存储最近有可能被经常访问的元数据。同时进一步研究了在缓存中选取高访问频率元数据表的算法,以实现通常访问的元数据信息存入内存数据库。通过这两种算法,把访问频率高的元数据存入内存,提高了数据注册中心对元数据的获取速度。本文的创新点与研究成果有:(1)提出了一种DOA下的数据注册中心元数据快速获取存储策略。本元数据存储策略,依据DOA下的元数据统一管理数据的要求,利用关系数据库的存储容量、内存数据库的访问效率和缓存动态存储作用,通过基于代价的缓存替换算法实现在缓存中动态存储最近有可能被经常访问的元数据,以提高元数据的获取速度与积累元数据的被访问频率;再通过基于代价函数的缓存选取算法,选取缓存中访问频率最高的元数据表存入内存数据库,完成元数据的内存数据库存储。在此基础上,设计了DOA下的数据注册中心的元数据存储结构模型,并依据此模型设计了DOA下的数据注册中心元数据存储系统。(2)提出了一种数据注册中心的替换缓存中访问权值最低元数据表的算法。通过对现存的几种常用缓存替换算法分析研究,从函数的角度,利用缓存数据表大小、访问次数、访问时间和获取缓存数据表的CPU时间,设计了一种基于代价函数的缓存替换算法,实现最近有可能被经常访问的数据表在缓存中的存储。(3)提出了一种数据注册中心的选取高访问频率元数据表存入内存数据库的算法。在对现存缓存替换算法研究的基础上,从函数的角度,利用缓存数据表大小、访问次数、访问时间和访问密度,设计了一种基于代价函数的缓存数据表选取算法,实现高访问频率元数据表从缓存到内存数据库的存储。