论文摘要
近年来,我国对网络科技资源管理领域的投入逐步加大,取得了举世瞩目的成绩。为了进一步提高网络科技资源的利用率,降低网络科技资源管理的成本,我国提出了建设“国家科技基础条件平台”的长期目标。本文的研究与应用背景即为“国家科技基础条件平台应用服务支撑系统”项目下的“网络科技资源应用集成环境建设”子项目,目标是建立一个可对分布式异构数据源节点上网络科技资源数据实施有效汇集的系统。本文以资源汇集技术理论为基础,结合网络科技资源管理领域的特点和项目的实际情况,综合运用资源汇集技术的物化方法和虚拟方法,给出了基于数据仓库的模块化的网络科技资源汇集模型。与已有基于数据仓库的资源汇集模型相比,本文给出的模型综合了多种集成方法的优点,不仅提供了对异构数据库的集成,也提供了对Web科技资源数据和目录数据的集成,在网络科技资源汇集领域内具有更好的通用性。模型包括主动获取、异构数据库集成和目录融合三个模块。在主动获取模块中,基于网络爬虫技术实现对网页科技资源的抽取;在异构数据库集成模块中,采用连接中间件插件式处理的方法实现对异构数据库的识别及异构数据库中数据的集成整合;在目录融合模块中,采用设计模式中的外观模式实现本地用户目录到标准分类目录的映射。此外,本文还针对资源汇集过程中共性问题,在网络科技资源汇集模型基础上,完成了对相关标准规范原型的提取,包括用于描述元数据相关信息的元数据规范、用于形成目录服务和建立目录服务器的目录生成及服务规范、用于约定集成内容与方法的资源汇集规范,以及负责日常维护的运行服务规范。本文将所给出的网络科技资源汇集模型及提取的相关标准规范原型实际应用于网络科技资源应用集成环境建设资源汇交系统中,并加以扩展实现。在系统内测阶段,成功集成了1T数据,说明本文给出的网络科技资源汇集模型应用效果良好。
论文目录
摘要Abstract1 绪论1.1 课题来源与意义1.2 资源汇集技术研究现状1.3 国际网络科技资源管理现状1.3.1 美国网络科技资源管理现状1.3.2 欧盟国家网络科技资源管理现状1.3.3 其他国家网络科技资源管理现状1.4 中国网络科技资源管理情况1.4.1 中国网络科技资源管理现状1.4.2 中国网络科技资源管理中存在的问题1.5 本文的主要内容1.5.1 本文的主要工作1.5.2 本文的组织结构2 资源汇集技术概述2.1 异构数据2.2 开发方法2.2.1 物化方法2.2.2 虚拟方法2.3 逻辑框架2.3.1 LAV2.3.2 GAV2.4 半结构化数据的抽取3 资源汇集模型的建立3.1 主动获取3.2 异构数据库集成3.2.1 业务流程3.2.2 异构数据库的识别3.2.3 元数据定制3.2.4 数据封装3.2.5 映射关系3.3 目录数据3.3.1 未分类数据的表示3.3.2 标准分类目录数据的表示3.3.3 目录数据的生成与服务提供3.4 目录融合3.4.1 准备阶段3.4.2 定制阶段3.4.3 保存阶段4 相关标准规范原型的提取4.1 元数据规范4.1.1 范围4.1.2 术语与定义4.1.3 元数据与网络科技资源的关系4.1.4 元数据提取分析的标准过程4.1.5 元数据接口描述4.2 目录生成及服务规范4.2.1 范围4.2.2 术语与定义4.2.3 应用原则4.2.4 设计原则4.2.5 分类体系4.2.6 参考模型框架4.2.7 应用说明4.3 资源汇集规范4.3.1 范围4.3.2 术语与定义4.3.3 资源汇集内容4.3.4 资源汇集手续流程4.3.5 数据源连接配置4.4 运行服务规范4.4.1 范围4.4.2 运行服务总则4.4.3 运行安全4.4.4 事故防范5 资源汇集模型的应用5.1 资源汇交系统的设计5.1.1 总体设计5.1.2 体系结构5.2 数据库设计5.3 资源汇交系统运行结果5.3.1 数据采集5.3.2 数据提交结论参考文献攻读硕士学位期间发表学术论文情况致谢
相关论文文献
标签:网络科技资源论文; 资源汇集论文; 异构数据库论文; 目录融合论文;