基因组结构注释数据WEB可视化系统构建

基因组结构注释数据WEB可视化系统构建

论文摘要

基因组测序工作快速发展,基因组结构注释成为破译基因组秘密的首要问题。纯粹基于实验方法的基因结构注释代价较高且难以适应基因组数据的迅速增长,因此,需要建立基因组结构注释系统,快速高效的得到基因组上的基因及相应的结构元件信息。NCBI、ENSEMBL、UCSC等国际著名机构都建立了各自的基因组结构大规模注释系统。然而却不提供对外服务,同时需要完善。为此,需要独立研制和开发高精度的基因组结构大规模注释系统,获取具有自主版权的基因组结构注释数据。如何存储这些注释数据,同时如何形象高效的展示这些数据信息,构建一个有效的Web可视化数据应用系统以供生物研究人员使用成为研制基因组结构大规模注释系统的重要问题。因此首先存储注释数据,然后重点构建数据的WEB可视化系统。对于人类基因组结构注释数据,由于其庞大的信息量及复杂的数据关系,使得研究人员必须掌握理解其生物学含义。通过以基因组注释的基因元件为核心的策略,构建了人类基因组结构注释数据库。同时通过水平分解、允许冗余、建立索引等策略提高了注释数据库系统的访问效率,实现了对WEB检索,可视化展示的有力支持。对于构建注释数据WEB可视化应用系统,首先分析和制定了可视化应用系统方案。确定分层、“语义缩放”及“轨道”的展示策略,同时详细制定了四层展示视图中的每一级展示内容及交互操作。然后论述了系统的实现过程,在实现过程中分析比较了几种适合基因组结构注释信息可视化的图形格式,并选取SVG作为展示图形的格式来生成图形,然后重点描述了基因轨道图形生成的两种算法,最后实现了查询输入、数据切换及辅助观察三大类交互接口来帮助生物研究人员使用分析注释数据。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 课题来源
  • 1.2 研究背景、目的及意义
  • 1.3 国内外现状
  • 1.3.1 基因组结构注释数据存储
  • 1.3.2 基因组结构注释数据可视化Web 服务
  • 1.4 主要研究工作及研究目标
  • 2 基因组注释数据的存储
  • 2.1 获取注释数据
  • 2.1.1 人类基因组结构注释系统
  • 2.1.2 人类基因组结构注释结果
  • 2.2 注释数据的分析与处理
  • 2.2.1 理解数据内容
  • 2.2.2 数据的分割处理
  • 2.2.3 选择数据库
  • 2.3 注释数据库的构建
  • 2.3.1 存储结构设计
  • 2.3.2 存储模型改进
  • 2.3.3 改进结果测试
  • 2.4 本章小结
  • 3 基因组注释数据 Web 可视化系统方案设计
  • 3.1 注释数据 Web 可视化问题分析
  • 3.2 注释数据 Web 可视化展示设计
  • 3.2.1 系统展示内容
  • 3.2.2 系统展示策略
  • 3.2.3 系统用户交互
  • 3.2.4 各级展示方案
  • 3.3 可视化系统框架设计
  • 3.4 本章小结
  • 4 基因组注释数据 Web 可视化系统实现
  • 4.1 系统实现的关键问题分析
  • 4.2 图形生成模块实现
  • 4.2.1 数据可视化图像格式的比较
  • 4.2.2 SVG 生成技术
  • 4.2.3 基因轨道图形生成
  • 4.2.4 ChromView 图形生成
  • 4.3 用户交互模块实现
  • 4.3.1 数据切换接口
  • 4.3.2 辅助观察接口
  • 4.4 本章小结
  • 5 总结与展望
  • 5.1 全文总结
  • 5.2 下一步工作
  • 致谢
  • 参考文献
  • 附录 1 攻读硕士学位期间发表的论文目录
  • 相关论文文献

    标签:;  ;  ;  

    基因组结构注释数据WEB可视化系统构建
    下载Doc文档

    猜你喜欢