论文摘要
基因组测序工作快速发展,基因组结构注释成为破译基因组秘密的首要问题。纯粹基于实验方法的基因结构注释代价较高且难以适应基因组数据的迅速增长,因此,需要建立基因组结构注释系统,快速高效的得到基因组上的基因及相应的结构元件信息。NCBI、ENSEMBL、UCSC等国际著名机构都建立了各自的基因组结构大规模注释系统。然而却不提供对外服务,同时需要完善。为此,需要独立研制和开发高精度的基因组结构大规模注释系统,获取具有自主版权的基因组结构注释数据。如何存储这些注释数据,同时如何形象高效的展示这些数据信息,构建一个有效的Web可视化数据应用系统以供生物研究人员使用成为研制基因组结构大规模注释系统的重要问题。因此首先存储注释数据,然后重点构建数据的WEB可视化系统。对于人类基因组结构注释数据,由于其庞大的信息量及复杂的数据关系,使得研究人员必须掌握理解其生物学含义。通过以基因组注释的基因元件为核心的策略,构建了人类基因组结构注释数据库。同时通过水平分解、允许冗余、建立索引等策略提高了注释数据库系统的访问效率,实现了对WEB检索,可视化展示的有力支持。对于构建注释数据WEB可视化应用系统,首先分析和制定了可视化应用系统方案。确定分层、“语义缩放”及“轨道”的展示策略,同时详细制定了四层展示视图中的每一级展示内容及交互操作。然后论述了系统的实现过程,在实现过程中分析比较了几种适合基因组结构注释信息可视化的图形格式,并选取SVG作为展示图形的格式来生成图形,然后重点描述了基因轨道图形生成的两种算法,最后实现了查询输入、数据切换及辅助观察三大类交互接口来帮助生物研究人员使用分析注释数据。
论文目录
相关论文文献
标签:基因组结构预测论文; 基因组数据库论文; 基因组数据可视化论文;