真核生物基因组结构自动注释系统研究

真核生物基因组结构自动注释系统研究

论文摘要

自从全基因组测序成为可能以来,基因组结构注释(包括了解基因组DNA中的基因组成、结构及其调控元件)成为生物信息学研究的重要问题。为此,需要建立基因组结构自动注释系统,快速方便地得到基因组上的基因及其结构元件信息等;与此同时,需要采用相关的技术和手段保存和管理注释数据,并使该数据信息能为全球web用户访问和使用,必要时还须提供数据的安全保护等。此外,由于基因组结构注释系统的计算量庞大,还需要基于高性能计算资源进行基因组结构注释计算。针对以上问题,从事了如下几个方面的工作:制订了整合不同的数据信息(如蛋白质序列、cDNA/mRNA序列、EST序列、全基因组序列等)和不同的基因结构预测方法(如蛋白质序列比对、EST序列分析、从头预测等)对基因组基因结构进行自动注释的整体流程,建立了基因组结构自动注释系统的整体框架。从基因结构规律提炼、EST数据挖掘利用、模型与算法设计、软件研制等方面对真核生物基因结构预测进行了研究,研制出了基因结构从头预测、基于EST的基因外显子区域识别等软件。建立了基因组结构注释数据库。以基因组结构注释元件为核心建立了数据库概念模型,可有效存储和管理基因组结构注释数据。基于数据库一次生成、多次访问的特征,通过采用允许冗余、允许关系表属性发生变化、细分实体等手段提高了数据存取效率。通过建立索引、依据坐标聚集性存储数据、数据预排序、分割数据、序列以二进制数据文件形式存储等措施,实现了对web检索访问、可视化浏览访问以及计算存取等的有效支持。采用数据库代码生成器降低了数据库开发代价。研制开发了基因组可视化浏览器,实现了对基因组结构注释数据的可视化浏览访问等。采用了国际三大著名基因组浏览器共同采用的显示“轨道”的方式可视化展示注释元件,并针对其存在的不足,提出了以注释元件为中心组织相关数据、聚集同类同层次数据以及基于SVG技术提供方便的交互式操作等改进措施。以自适应步长的轨道漫游和自适应分辨率的轨道放缩等措施完善了以染色体为中心的导航策略。建立了在高性能计算环境下整合上述注释软件、数据库以及web访问接口等的基因组结构自动注释系统。采用基于网格计算和集群计算的两级调度体系结构完成了基因组结构自动注释系统在高性能计算环境下的部署。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 课题来源、目的与意义
  • 1.1.1 课题来源
  • 1.1.2 课题目的与意义
  • 1.2 基因组结构注释系统的国内外研究现状
  • 1.2.1 基因组结构注释
  • 1.2.2 基因组结构注释的web 服务
  • 1.3 本文的研究内容
  • 1.4 本文的组织结构
  • 2 基因组结构注释系统总体框架
  • 2.1 基因组结构注释系统
  • 2.1.1 注释流程与系统框架
  • 2.1.2 基于蛋白质序列信息的基因注释
  • 2.1.3 cDNA 基因注释
  • 2.1.4 EST 基因注释
  • 2.1.5 基因结构从头预测
  • 2.1.6 融合全基因组相似性信息的基因结构预测
  • 2.2 基因组结构注释数据库系统
  • 2.3 基因组注释数据浏览器
  • 2.4 基于高性能计算环境的基因组结构注释系统
  • 2.5 本章小节
  • 3 基因组结构注释方法
  • 3.1 基于EST 序列数据识别基因结构
  • 3.1.1 判别基因序列的真实EST 匹配的措施
  • 3.1.2 基于EST 序列数据识别基因结构的流程
  • 3.1.3 基于EST 序列数据识别基因结构的效果
  • 3.2 基因结构预测的统计学建模方法
  • 3.2.1 基于多级优化预测基因结构的基本思想
  • 3.2.2 基因结构的分级建模
  • 3.2.3 基因结构预测的动态规划算法
  • 3.2.4 结果与分析
  • 3.3 融合全基因组相似性信息的基因结构预测
  • 3.3.1 训练集与测试集
  • 3.3.2 基因组匹配中相似性信息的挖掘
  • 3.3.3 将相似性信息整合于基因结构从头预测方法
  • 3.3.4 结果与分析
  • 3.4 本章小节
  • 4 基因组结构注释数据库
  • 4.1 任务分析
  • 4.1.1 难点分析
  • 4.1.2 国内外现状
  • 4.1.3 数据库的特征分析
  • 4.1.4 研制的基本策略
  • 4.2 需求分析
  • 4.2.1 涵盖的信息
  • 4.2.2 基因组结构注释数据事务处理
  • 4.3 以注释元件为核心的概念模型
  • 4.3.1 以元件为核心组织数据
  • 4.3.2 原始概念模型
  • 4.3.3 模型优化
  • 4.4 以支持高效事务处理为目标的数据库存储优化
  • 4.4.1 针对坐标检索优化存储表结构
  • 4.4.2 基于序列内容检索的支持
  • 4.5 基因组结构注释数据库代码生成器
  • 4.5.1 代码生成器
  • 4.5.2 数据库及其访问工具选型
  • 4.5.3 描述基因组结构注释对象
  • 4.6 本章小节
  • 5 基因组可视化浏览器
  • 5.1 引言
  • 5.1.1 背景意义
  • 5.1.2 任务分析
  • 5.1.3 国内外现状
  • 5.2 方案制定
  • 5.2.1 数据可视化展示策略
  • 5.2.2 可视化导航浏览策略
  • 5.3 以注释元件为中心的数据展示
  • 5.3.1 分层展示
  • 5.3.2 注释元件块
  • 5.4 以染色体为中心的导航策略改进
  • 5.4.1 自适应步长的轨道漫游
  • 5.4.2 自适应分辨率的轨道放缩
  • 5.5 基于SVG 的基因组可视化浏览器开发
  • 5.5.1 技术需求分析
  • 5.5.2 网络图形技术现状
  • 5.5.3 SVG 技术分析
  • 5.5.4 采用SVG 制作基因组可视化浏览器
  • 5.6 本章小节
  • 6 基因组结构注释系统的网络部署
  • 6.1 基因组结构注释系统的整体框架
  • 6.2 基因组结构注释数据库 web 应用系统
  • 6.3 系统的计算业务需求
  • 6.3.1 计算面临的问题
  • 6.3.2 国内外现状
  • 6.3.3 基因组结构自动注释计算业务需求
  • 6.4 基于网格技术的系统解决方案
  • 6.4.1 目前拥有的硬件环境
  • 6.4.2 系统的软硬件体系结构
  • 6.5 系统实施
  • 6.5.1 基于高性能计算环境的生物信息计算
  • 6.5.2 生物信息网格计算服务
  • 6.5.3 系统的网格服务部署
  • 6.6 本章小节
  • 7 总结
  • 7.1 本文的工作
  • 7.2 进一步的工作
  • 致谢
  • 参考文献
  • 附录1 攻读博士学位期间的学术论文及获奖情况
  • 附录2 攻读博士学位期间参加的主要科研项目
  • 相关论文文献

    • [1].注释范例[J]. 国际比较文学(中英文) 2019(04)
    • [2].更正[J]. 电影艺术 2020(01)
    • [3].注释范例[J]. 国际比较文学(中英文) 2020(01)
    • [4].道经注释语言研究——以《洞玄灵宝自然九天生神章经解义》为中心[J]. 郑州师范教育 2020(02)
    • [5].注释范例[J]. 国际比较文学(中英文) 2019(02)
    • [6].注释位置、注释语言和自注释对英语阅读中词汇学习效果的影响[J]. 解放军外国语学院学报 2017(06)
    • [7].为何你的志向堂堂正正[J]. 中国测绘 2017(05)
    • [8].基于语料库技术的形容词注释实态调查[J]. 辞书研究 2016(03)
    • [9].注释方式对第二语言阅读中词汇附带习得影响的研究综述[J]. 海外英语 2016(08)
    • [10].注释方式对二语词汇附带习得影响的研究综述[J]. 语文学刊(外语教育教学) 2015(01)
    • [11].生词注释对限时阅读理解与词汇附带习得的影响[J]. 外语与外语教学 2015(01)
    • [12].二语阅读中不同注释方式对词汇附带习得的影响[J]. 海外英语 2015(05)
    • [13].多媒体注释对英语机助听力理解和词汇附带习得影响的实证研究[J]. 解放军外国语学院学报 2015(03)
    • [14].论新时期以来长篇小说的注释叙事——以《三个三重奏》为中心[J]. 宁夏社会科学 2015(04)
    • [15].本期注释索引[J]. 家族企业 2020(04)
    • [16].学者不加注释的著作[J]. 广州文艺 2020(06)
    • [17].基于多媒体词边注释的中职英语阅读微信小程序满意度及影响因素研究[J]. 英语教师 2020(10)
    • [18].练习17 字词注释训练[J]. 语文月刊 2019(12)
    • [19].人教版八年级文言文注释商榷[J]. 学语文 2015(06)
    • [20].作注释莫草率[J]. 中学语文教学参考 2016(13)
    • [21].不需注释的生命[J]. 中华活页文选(高一年级) 2014(12)
    • [22].文言文注释辨误八例[J]. 语文天地 2015(01)
    • [23].人教版高中语文教材动植物名词注释商榷[J]. 考试(教研版) 2012(11)
    • [24].春昼[J]. 小学生作文选刊 2013(08)
    • [25].苏教版文言文注释指瑕[J]. 中学语文 2009(30)
    • [26].习惯[J]. 小学生必读(中年级版) 2009(06)
    • [27].新注释[J]. 杂文月刊 2010(06)
    • [28].文言文注释问题商榷[J]. 中学语文 2010(10)
    • [29].季节的注释[J]. 语文教学与研究 2008(15)
    • [30].注释范例[J]. 国际比较文学(中英文) 2020(02)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    真核生物基因组结构自动注释系统研究
    下载Doc文档

    猜你喜欢