基于系统发育分析的基因表达数据处理方法和基因水平转移检测软件

基于系统发育分析的基因表达数据处理方法和基因水平转移检测软件

论文摘要

系统发育分析方法是进化生物学研究中的重要方法论工具,也是目前生物信息学中数据分析的主要方法之一。本文将系统发育分析方法应用于基因芯片数据分析和基因组中水平转移基因检测,为解决这两个生物信息学问题开拓了新的思路。随着基因组学的发展,基因芯片技术已广泛用于在基因组水平上监控基因表达水平。一直以来,基因芯片的数据分析方法主要是聚类分析,其目的是降低数据维数,并在此基础上进一步分析得到新的生物学知识。但是,这种策略本身没有可靠的分类指标和可靠的统计学或生物学背景,结论往往依赖于研究人员的主观判断。本文第一部分用系统发育的方法分析了丝氨酸蛋白酶抑制剂(serine protease inhibitor,serpin)基因的基因芯片表达数据。到目前为止,研究人员已经对serpin基因超家族各成员的生理学功能及其特征进行了较为详尽的研究,然而,人们对serpin基因的进化模式仍然不甚清楚。这个超家族的基因重复研究可能对解决这个问题提供一些启示。目前,有两个模型用来预测重复基因的保留(preservation):经典模型和重复—变性—互补模型(duplication-degeration-complementation model,DDC model)。在本文中,我们利用诱导表达转录因子AML-ETO基因的U937细胞的时间系列基因芯片数据,检测了人类serpin基因家族多个成员的序列和表达分歧之间的关联。我们用人类serpin基因家族的蛋白质编码区重建了其系统发育关系,然后将基因表达数据标记在简化的系统发育树上,并检测了基因突变速率同基因表达样式之间的相关性。我们发现在serpin基因超家族的SERPINA和SERPINB家族的成员中,基因的同义突变速率同表达数据的时间分歧之间具有相关性。然后,我们用这种相关性来检测了不同基因进化模型的有效性,发现serpin基因超家族的成员是按照DDC基因重复模型进化的。我们的研究提供了一个新的基因序列和芯片数据的比较分析方法。为了能够将这个工作扩展到基因组水平,本文设计并初步实现了PhyloExp软件包。本文第二部分将系统发育分析的方法应用于检测微生物基因组中的水平转移基因。上世纪50年代末科研人员发现基因水平转移现象以来,科研人员已经逐渐接受了这一概念。在这一部分中,我们首先详细介绍了两个免费的软件:微软Windows操作系统上运行的T-REX和Linux操作系统上运行的RHOM。T-REX是一个图形界面程序,它利用基因和物种距离矩阵来重新构建供体和受体物种间的基因水平转移网络。RHOM是一组命令行驱动程序,用以根据基因组序列特征检测基因水平转移。T-REX图形界面和绘制网状结构图的功能给人留下了很深的印象;而RHOM最为突出的就是其严谨的基因组统计学框架及其图像化显示候选水平转移基因序列位点概率估计值。这两个软件分别对应两种分析策略:一种称为替代算法,另一种称为系统基因组策略。然而,这两种方法都有其不可克服的局限性,一方面,替代算法不能给出基因的来源;另一方面,系统基因组学策略无法解决“孤儿”基因的问题。由此,我们设计了HAPLY软件,它首先通过本地替代算法来检测基因组可能的水平转移基因,然后通过利用网络资源来实现单基因的系统发育基因组学策略,来确定其可能的来源,从而将两类算法有机的整合在一起。本文初步设计并实现了HAPLY软件,为进一步工作奠定了基础。

论文目录

  • 摘要
  • Abstract
  • 第一部分 基于系统发育分析的基因表达数据处理方法及其应用
  • 第1章 基因芯片分析的基本方法
  • 1.1 简介
  • 1.1.1 基因芯片发展史及分类
  • 1.1.2 基因芯片检测基因差异表达
  • 1.1.3 基因芯片数据的存储和分析
  • 1.2 基因芯片数据分析方法
  • 1.2.1 简介
  • 1.2.2 距离测度
  • 1.2.3 聚类分析
  • 第2章 检测基因序列与表达分歧间的关联:以SERPIN基因为例
  • 2.1 研究背景
  • 2.1.1 丝氨酸蛋白酶抑制剂的生理和病理学功能
  • 2.1.2 同义和非同义核苷酸替代
  • 2.1.3 基因重复 DDC进化模型
  • 2.1.4 SERPIN基因的进化
  • 2.2 材料和方法
  • 2.2.1 序列下载和序列分析
  • 2.2.2 基因芯片数据
  • 2.2.3 系统发育分析
  • 2.2.4 表达分析和标记
  • 2.2.5 统计分析
  • 2.3 结果与分析
  • 2.3.1 人类SERPIN基因间的系统发育关系
  • 2.3.2 将SERPIN超家族的表达数据标记在系统发育树上
  • 2.4 讨论
  • 第3章 PhyloExp:一个基因表达数据系统发育分析软件
  • 3.1 PhyloExp系统的设计与实现
  • 3.1.1 程序基本框架
  • 3.1.2 程序实现的方法
  • 3.2 PhyloExp的应用实例
  • 3.2.1 基因芯片数据
  • 3.2.2 芯片数据标记细胞凋亡网络图
  • 3.3 进一步的工作
  • 第二部分 基因水平转移检测软件的设计与实现
  • 第4章 基因水平转移概述
  • 4.1 基因水平转移的定义
  • 4.2 基因水平转移生物学机制及若干问题
  • 4.2.1 由质粒或病毒等介导的基因水平转移
  • 4.2.2 基因的“直接”水平转移
  • 4.2.3 基因水平转移的若干问题
  • 第5章 用T-REX和RHOM程序检测基因水平转移
  • 5.1 现有检测基因水平转移软件和算法
  • 5.2 T-REX和RHOM程序的安装或编译
  • 5.3 详述T-REX和RHOM程序的使用
  • 5.3.1 T-REX软件
  • 5.3.2 RHOM程序包
  • 5.4 用RHOM和T-REX程序检测基因水平转移
  • 5.5 讨论
  • 第6章 HAPLY软件的基本框架
  • 6.1 HAPLY的设计
  • 6.1.1 背景
  • 6.1.2 Haply流程图
  • 6.2 编程工具
  • 6.2.1 Microsoft Visual C++ 6.0
  • 6.2.2 EMBOSS for Windows
  • 6.2.3 QBlast
  • 6.2.4 Blammer
  • 6.2.5 Entrez Programming Utilities
  • 6.2.6 Matlab
  • 6.3 输入文件的处理
  • 6.4 替代算法的实现
  • 6.4.1 Wn算法
  • 6.4.2 Lawrence97算法
  • 6.5 系统基因组学方法的实现
  • 6.5.1 远程BLAST
  • 6.5.2 获取基因所属物种的分类学信息
  • 6.5.3 识别异常系统发育关联
  • 6.6 进一步的工作
  • 参考文献
  • 附录 1 攻读博士学位期间发表的论文
  • 附录 2 CNetBlast类源代码
  • WnOnlineResult.pl'>附录 3 ParseWnOnlineResult.pl
  • 致谢
  • 附:论文相关的己发表论文
  • 相关论文文献

    • [1].走向临床的基因芯片[J]. 科学新闻 2013(07)
    • [2].基因芯片撬动的产业[J]. 新知客 2008(04)
    • [3].高污染基因芯片图像的网格划分[J]. 应用光学 2019(01)
    • [4].基因芯片[J]. 中华关节外科杂志(电子版) 2010(04)
    • [5].基因芯片在孕期提供最全面的诊断信息[J]. 中国产前诊断杂志(电子版) 2017(03)
    • [6].基因芯片:春天在哪里[J]. IT经理世界 2012(03)
    • [7].基于表面等离子体共振的基因芯片制备与检测[J]. 生物医学工程学杂志 2009(03)
    • [8].基因芯片核心技术及其最新进展[J]. 国际检验医学杂志 2009(05)
    • [9].基因芯片:小身材,大胃口[J]. 大科技(科学之谜) 2008(07)
    • [10].基因芯片结核分枝杆菌耐多药检测在地市级实验室的应用性评估[J]. 中国防痨杂志 2013(09)
    • [11].应用基因芯片方法检测结核分枝杆菌利福平和异烟肼的耐药性[J]. 中国防痨杂志 2011(10)
    • [12].基因芯片在肉品检测中的应用[J]. 肉类研究 2008(01)
    • [13].“基因芯片”快速检测禽流感[J]. 北方园艺 2013(01)
    • [14].基因芯片在耳鼻咽喉-头颈外科学中的应用[J]. 实用医学杂志 2008(06)
    • [15].甲型H1N1病毒基因芯片研制成功[J]. 中国医疗器械杂志 2009(03)
    • [16].基因芯片技术的发展和应用[J]. 中国医学科学院学报 2008(03)
    • [17].基因芯片联合检测妊娠高血压综合征相关基因的多态性[J]. 安徽医学 2013(08)
    • [18].基因芯片、计算机与作物研究新进展[J]. 国际学术动态 2011(05)
    • [19].一种基于单亲遗传算法的基因芯片的筛选方法[J]. 福建电脑 2012(10)
    • [20].基因芯片在细菌及其耐药检测中的应用[J]. 国际检验医学杂志 2011(02)
    • [21].基因芯片在胃癌基因表达谱中的应用[J]. 癌变.畸变.突变 2008(06)
    • [22].CYP2C19显色型基因芯片的研究[J]. 中国医药生物技术 2015(01)
    • [23].基因芯片作为一线诊断技术在产后患者诊断中的应用[J]. 中国产前诊断杂志(电子版) 2013(02)
    • [24].应用于dPCR基因芯片的荧光精缩无限远物镜设计[J]. 光学技术 2019(05)
    • [25].条斑紫菜优良品系的基因芯片表达谱分析[J]. 天津农业科学 2015(04)
    • [26].我国首个甲型流感病毒耐药分析基因芯片问世[J]. 中国当代医药 2009(10)
    • [27].基因芯片在消化道肿瘤研究中的应用现状[J]. 中国实用内科杂志 2008(09)
    • [28].基因芯片快速检测脑脊液常见病原菌的应用研究[J]. 标记免疫分析与临床 2018(03)
    • [29].基于回归分析的基因芯片图像倾斜校正方法[J]. 大连民族学院学报 2010(01)
    • [30].透明导电薄膜载体材料在无标记电化学基因芯片中的应用[J]. 中国组织工程研究与临床康复 2010(29)

    标签:;  ;  ;  ;  ;  ;  ;  

    基于系统发育分析的基因表达数据处理方法和基因水平转移检测软件
    下载Doc文档

    猜你喜欢