基于元数据的蛋白质组数据资源整合关键技术研究与应用平台开发 ——元数据自动提取、导入与检索工具的设计

基于元数据的蛋白质组数据资源整合关键技术研究与应用平台开发 ——元数据自动提取、导入与检索工具的设计

论文摘要

21世纪是生命科学的时代,也是信息时代。随着生物学技术的不断提高和人类基因组计划的实施,生物数据呈指数增长,对这些海量生物数据的整合、共享、集成与分析具有重要的理论价值和实际意义。由于生物数据固有的复杂性以及存储方法、数据库结构、数据库表和属性以及数据条目的命名、访问方法等方面存在异构性,使传统的生物信息集成和整合遇到了巨大的困难和挑战。本文首先分析了现有生物数据集成方法及其存在不足,研究了元数据和生物学本体及其在生物信息集成中的作用,并在此基础上探讨了整合平台中公共元模型和本体库的建立,然后将传统的基于中介模式的数据集成方法和本体技术相结合,提出了分布式环境下基于元数据的生物信息集成框架(MOBIB),并对其中的关键模块元数据自动提取、转换和导入工具RSchemaETS进行了分析和设计。RSchemaETS实现了关系数据库元数据的自动提取、转换和导入,具有良好的可扩展性和可重用性,各模块之间实现了高内聚低耦合,使得实现其它的DBMS元数据自动提取、转换和导入变得非常简单。基于JavaCC的实现方法不仅可以简化系统实现,而且使实现者只用关心SQL语句的BNF范式中需要提取的元数据和处理逻辑,并且当RDBMS SQL语法修改后可以通过少量的修改即可,为工具的向后兼容提供了保证。最后结合生物学家的查询需求和本体查询语言特征,定义了MOBIB集成平台的查询语言,并对查询语言解释执行器的处理流程和系统结构进行了分析和讨论。MOBIB集成平台可以在异构分布的多数据源环境中回答用户提交的查询,而不用一个中心的数据仓库或一个通用的全局本体。基于元数据的集成方法把结构元数据和语义元数据应用于对多数据源查询处理的各个阶段,以求解决生物信息集成中存在的结构异构、语义异构、术语异构等问题。该方法具有较好的应用前景,通过引入相应领域的本体,可以应用于各个生物学领域的数据集成和整合中。目前,已经将该方法应用于“基于元数据的蛋白质组数据资源整合关键技术研究与应用平台开发”中,并引入Gene Ontology等生物学本体,解决蛋白质组数据资源整合中的异构问题。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 立题背景及意义
  • 1.1.1 生物信息集成概述
  • 1.1.2 生物信息集成的问题和难点
  • 1.1.3 生物信息集成方法及发展现状
  • 1.2 课题研究内容
  • 1.3 论文结构
  • 第二章 相关技术研究
  • 2.1 元数据与元模型研究
  • 2.1.1 元数据与元模型定义
  • 2.1.2 CWM 元模型
  • 2.1.3 DBMS 元数据与整合平台元模型建立
  • 2.2 本体研究及其在生物信息集成中的作用
  • 2.2.1 本体
  • 2.2.2 现有生物学本体及其应用
  • 2.2.3 本体在数据集成中的作用及发展现状
  • 2.2.4 集成和整合平台中本体库的建立
  • 第三章 基于元数据的蛋白质组学数据资源整合平台研究
  • 3.1 蛋白质组学数据资源整合需求
  • 3.2 基于元数据的生物数据集成平台设计思想
  • 3.3 基于元数据的蛋白质组学数据集成整体架构
  • 3.4 与同类系统的比较分析
  • 第四章 数据库模式元数据自动提取与转换工具设计与实现
  • 4.1 RSCHEMAETS 的设计
  • 4.1.1 RSchemaETS 工具工作流程
  • 4.1.2 元数据提取、转换与导入的关键问题
  • 4.1.3 RSchemaETS 设计整体思想与实现框架
  • 4.2 JAVACC 编程简介
  • 4.2.1 JavaCC 编程概述
  • 4.2.2 BNF 范式
  • 4.2.3 JavaCC 在元数据自动提取与转换中的作用
  • 4.3 RSCHEMAETS 的实现与实例
  • 4.3.1 元数据自动提取和转换模块实现
  • 4.3.2 元数据缓存模块的实现
  • 4.3.3 元数据导入模块的实现
  • 4.3.4 RSchemaETS 的扩展和重用
  • 4.3.5 RSchemaETS 提取与导入实例
  • 第五章 查询语言及查询语言解释执行器的设计与研究
  • 5.1 MOBIB 中的查询框架和处理流程
  • 5.1.1 查询需求分析
  • 5.1.2 查询系统框架和处理流程
  • 5.2 MOBIB 框集中查询功能设计
  • 5.2.1 查询语言设计
  • 5.2.2 映射与查询生成与划分
  • 5.3 查询案例分析
  • 第六章 结束语
  • 致谢
  • 参考文献
  • 作者在攻读硕士学位期间论文发表情况
  • 作者在攻读硕士学位期间参与的科研项目
  • 附录A 裁减后CWM 各包的类图
  • 相关论文文献

    • [1].基于本体的电子文件元数据[J]. 中国档案 2020(03)
    • [2].保存元数据的发展趋势研究[J]. 图书馆杂志 2016(06)
    • [3].气象传输交换控制元数据的设计与实现[J]. 计算机技术与发展 2019(07)
    • [4].档案元数据研究现状简析[J]. 中山大学研究生学刊 2018(04)
    • [5].基于预测的输变电工程元数据分级索引算法[J]. 计算机工程与设计 2019(11)
    • [6].资源建设需要推进元数据战略[J]. 数字图书馆论坛 2017(11)
    • [7].浅析元数据概念在档案领域中的发展[J]. 机电兵船档案 2015(01)
    • [8].档案管理视角下的电子文件元数据[J]. 中国档案 2014(04)
    • [9].国内外描述性元数据研究综述[J]. 四川图书馆学报 2013(04)
    • [10].论电子文件中心元数据方案的管理策略[J]. 档案学通讯 2012(06)
    • [11].元数据在知识管理中的应用[J]. 辽宁师范大学学报(社会科学版) 2011(03)
    • [12].数据仓库中多维元数据的组织研究[J]. 信息与电脑(理论版) 2010(12)
    • [13].元数据应用规范研究[J]. 现代图书情报技术 2010(12)
    • [14].OCLC为出版商启动元数据服务[J]. 现代图书情报技术 2009(11)
    • [15].基于多维度的元数据检索算法研究与实现[J]. 电子设计工程 2020(19)
    • [16].基于本体的电子文件元数据:智慧档案馆建设的关键与核心[J]. 山西档案 2019(05)
    • [17].电子发票核心元数据构成与捕获研究[J]. 北京档案 2018(08)
    • [18].也谈“元数据”[J]. 中国统计 2012(06)
    • [19].用户元数据初探[J]. 图书馆杂志 2010(07)
    • [20].元数据在图书馆音像资料管理中的应用[J]. 科技信息 2010(27)
    • [21].数字资源的元数据自动获取系统[J]. 苏州大学学报(自然科学版) 2009(01)
    • [22].长期保存元数据在文物数字化保护项目中的应用[J]. 数字图书馆论坛 2020(06)
    • [23].元数据的多角度诠释[J]. 档案 2019(05)
    • [24].布鲁姆分类学对提高大学生元数据素养的指导意义[J]. 吉林省教育学院学报(下旬) 2014(01)
    • [25].电子档案元数据分开管理研究[J]. 中国档案 2014(09)
    • [26].数字图书馆的元数据方案及互操作研究[J]. 图书馆学刊 2011(02)
    • [27].中美高校元数据课程的现状与启示[J]. 大学图书馆学报 2011(05)
    • [28].浅析元数据在档案领域的应用[J]. 兰台世界 2009(03)
    • [29].数字图书馆中基础管理性元数据框架研究[J]. 图书馆杂志 2008(06)
    • [30].企业信息化元数据管理方法研究[J]. 中国信息化 2018(04)

    标签:;  ;  ;  ;  ;  ;  

    基于元数据的蛋白质组数据资源整合关键技术研究与应用平台开发 ——元数据自动提取、导入与检索工具的设计
    下载Doc文档

    猜你喜欢