关于部分排序的基因组重组问题的研究

关于部分排序的基因组重组问题的研究

论文摘要

基因组重组是计算生物学和生物信息学的一个重要研究领域,许多研究表明,基因组重组是生物进化的一种普遍模式,也是植物、哺乳动物及细菌等呈现多样性的主要原因之一。1938年,Dobzhansky和Sturtevant开创了基因组重组的分子生物学分析,他们发表了里程碑式的论文,文中对果蝇基因组提出了含17次反转操作的重组方案。就最简单的形式而言,将一种基因组转换为另一种基因组的重组可以用寻找最小转换次数的组合问题来模拟。随着大规模作图和测序的出现,在不同的领域内有关基因组比较问题的数目迅速增长,这些领域包括病毒、细菌、酵母、植物和动物的进化。在20世纪80年代末,Jeffrey Palmer和他的同事们在植物细胞器中发现了一种有关进化变异不寻常的新的模式。他们比较了甘蓝和芜菁甘蓝的线粒体基因组,两者之间的联系非常紧密(许多基因是99%同源的)。令他们感到惊奇的是,这些分子在基因序列上几乎相同,但在基因排列次序上则有显著的差别。这个发现和后来十年中许多其他的研究令人信服地证明了基因组重组是分子进化的一种模式[49]。基因组是一组染色体的集合,一条染色体是一个基因序列,用一个整数序列来表示。每个基因都有方向。当每个基因的方向在一个有符号基因组中是已知时,用带符号的整数表示该基因组中的基因。当基因的方向在一个无符号基因组中都是未知时,用不带符号的整数表示该基因组中的基因。给定两个基因组,重组排序问题是要计算一个重组操作序列,将其中一个基因组转化为另一个基因组,并使得重组操作次数最少。对于有符号基因组的重组问题,重组操作在改变基因序列的同时也改变基因的符号;对于无符号基因组的重组排序问题,重组排序操作只改变基因序列,不会改变基因的符号。虽然基因组的重组过程十分复杂,但是只存在几种基本的操作:反转,移位和对换。通常情况下,基因组重组问题可以进行如下简化:即假设基因组中不存在重复的基因。在这一简化下,对于一个含有n个基因的基因组,我们通常用定义在{1,2,…,n}上的一个排列来表示。若一个基因组可以仅通过移位操作变换为另一个基因组,那么首先这两个基因组必须有相同的基因集合。但是在生物学实际中,这种情况非常少见。所以我们需要考虑一般的情形:即两个基因组含有不同的基因集合时的情况。显然,在这种情况下,“删除”或“插入”将成为必需的操作。我们的目标仍然是通过最少的重组操作(移位、删除或插入),将源基因组转化为目标基因组。大部分比较基因组学研究假设一条染色体中的基因的排列次序是给定的,但是目前的基因图谱技术,比如重组分析和物理成像等,经常由于缺乏解决的方法,使得基因图谱中几个基因位于同一个位置或者遗漏一些其它的基因,这就使得将它们结合起来仅能产生基因组的一个部分排序而不是全排序。本文主要研究部分排序的基因组重组问题。分四章进行讨论:在第一章中概述基因组重组排序的基本概念及算法。第二章主要研究部分排序基因组断点距离(PBD)问题,即给定两个含有相同基因集合的部分排序基因组Π和Γ,分别找到Π和Γ的一个可能的全序排列L(Π)和L(Γ),使得L(Π)和L(Γ)之间的断点距离db(Π,Γ)最小。在这一章中给出了计算两个部分排序基因组之间断点距离的一个O(n4)启发式算法,其中n为所考虑基因组中基因的个数。文中,我们首先引入了一个新的组合优化问题-最小双断点集问题(MDBVS),并且给出了该问题的一个2(m2+4m-3)-近似算法,其中m是分别构成两个部分排序的基因组所需要的最大基因图谱的个数,然后根据PBD问题和MDBVS问题之间的关系,设计了解决PBD问题的一个启发式算法。它们之间的关系由下面的定理给出:定理设|MDBVS|是最小的双断点集所含元素的个数,|W|是W中元素的个数,n表示Π中所含基因的个数。则db(Π,Γ)=n-1-|W|+|MDBVS|。由上述定理可以看出,如果|W|<n,其中W为我们在本章中定义的所有可能的共同邻接的集合,则由MDBVS问题的一个2(m2+4m-3)-近似算法可以很容易地得出PBD问题的一个2(m2+4m-3)-近似算法。在计算生物学中,如果一组同源基因(即有一个共同祖先的基因)在两个不同的物种中共同存在,则这些基因可能在共同的祖先那里是保持在一起的,并且在以后的进化过程中也不被分开。这样的一组结合在一起的同源基因称为公共区间[32]。因此,最近又出现了另外一个组合优化问题,称为完美排序问题,它是指寻找一组最少的重组操作,使得当由一个基因组转化为另一个基因组时,这些重组操作不破坏所考虑基因组的公共区间。在第三章中,我们推广了Berard等人[5]关于基因反转完美排序问题的一个算法,考虑允许有删除和限制条件的插入(即不允许有重复基因)操作的基因组完美重组问题。在第四章中,我们研究了含有不同基因集合的部分排序基因组重组问题,即给定两个含有不同基因集合的部分排序的基因组,分别找到它们的一个可能的全排序,使得从一个全排序到另外一个全排序所需要的重组操作次数最少。显然,在这种情况下,插入和删除将成为必须的操作。在这一章中,我们推广了zheng等人[70]的算法,设计了一个解决允许有删除和插入操作的部分排序基因组重组问题的算法,并且举例说明该算法的可行性。

论文目录

  • 摘要
  • Abstract
  • 符号说明
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 基本定义和符号
  • 1.3 基因组重组中的几个组合问题
  • 1.3.1 反转排序问题
  • 1.3.2 对换排序问题
  • 1.3.3 移位排序问题
  • 1.3.4 多种操作排序问题
  • 1.3.5 反转完美排序问题
  • 1.3.6 基因组重复
  • 1.3.7 基因组重组和系统发育研究
  • 1.4 论文结构
  • 第二章 部分排序基因组之间的断点距离
  • 2.1 内容简介
  • 2.2 前言介绍
  • 2.3 预备知识
  • 2.4 PBD问题的算法
  • п(或Gг)中所有的冲突圈'>2.4.1 破坏Gп(或Gг)中所有的冲突圈
  • 2.4.2 最小双断点集问题
  • 2.4.3 MBVS问题的一个近似算法
  • 2.4.4 MDBVS问题的一个近似算法
  • 2.4.5 PBD问题的启发式算法
  • 2.5 总结
  • 第三章 包含反转和删除(插入)操作的完美排序
  • 3.1 内容简介
  • 3.2 前言介绍
  • 3.3 预备知识
  • 3.4 包含反转和删除(或插入)操作的完美排序
  • 3.5 包含反转、删除和插入操作的完美排序
  • 3.6 总结
  • 第四章 含有不同基因集合的部分排序基因组重组
  • 4.1 内容简介
  • 4.2 前言介绍
  • 4.3 预备知识
  • 4.4 算法
  • 4.4.1 背景
  • 4.4.2 推广到部分排序
  • 4.5 总结
  • 参考文献
  • 致谢
  • 攻读博士学位期间完成论文情况
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].美国材料基因组战略的进展及我国的对策建议[J]. 全球科技经济瞭望 2020(02)
    • [2].基因组编辑农业动物及其管理的共识[J]. 中国农业科学 2020(09)
    • [3].基因组挖掘在天然产物研究中的应用进展[J]. 化学与生物工程 2017(02)
    • [4].基因组的退化[J]. 高科技与产业化 2017(05)
    • [5].基因组选择研究进展及其在林木中的发展趋势[J]. 北京林业大学学报 2020(11)
    • [6].滩羊毛色的全基因组关联分析[J]. 浙江农业学报 2020(01)
    • [7].大量提取羊草基因组方法的优化[J]. 安徽农业科学 2020(06)
    • [8].基因组“暗物质”摭谈[J]. 生物学教学 2020(04)
    • [9].基因组编辑技术在精准医学中的应用[J]. 遗传 2017(03)
    • [10].基因组编辑育种技术及国内外发展态势分析[J]. 生物产业技术 2016(04)
    • [11].基因组“暗物质”作用正逐渐被揭示[J]. 生物医学工程与临床 2013(06)
    • [12].转录组测序揭示翼盖蕨(Didymochlaena trancatula)的全基因组复制历史[J]. 生物多样性 2019(11)
    • [13].基因组选择在猪杂交育种中的应用[J]. 遗传 2020(02)
    • [14].柚子基因组比较分析以及祖先染色体重构[J]. 河北农业大学学报 2020(01)
    • [15].四种提取方法提取玉米基因组的比较[J]. 农业开发与装备 2017(12)
    • [16].基因组选择一步法理论及应用研究进展[J]. 广东农业科学 2016(09)
    • [17].全基因组关联分析研究现状及展望[J]. 上海畜牧兽医通讯 2017(03)
    • [18].尾分析法在不同规模群体中开展全基因组关联研究[J]. 畜牧兽医学报 2017(07)
    • [19].多元自动化基因组工程[J]. 生物技术通报 2015(06)
    • [20].基因组医学:过去、现在和将来[J]. 世界科学 2011(06)
    • [21].基因组改组技术及其在工业微生物改良中的应用[J]. 食品与发酵工业 2011(07)
    • [22].糖皮质激素的非基因组作用及机制[J]. 当代医学 2010(06)
    • [23].后基因组时代——进展、问题、经验与前景[J]. 生理科学进展 2010(04)
    • [24].基于枯草芽孢杆菌产物应用的基因组精简研究进展[J]. 生命的化学 2020(04)
    • [25].高通量计算在大规模人群队列基因组数据解析应用中的挑战[J]. 数据与计算发展前沿 2020(01)
    • [26].恶性肿瘤或有好转临界点[J]. 世界最新医学信息文摘 2019(09)
    • [27].恶性肿瘤或有好转临界点[J]. 世界最新医学信息文摘 2019(11)
    • [28].基因组3D结构的功能研究[J]. 科学技术创新 2019(30)
    • [29].恶性肿瘤或有好转临界点[J]. 世界最新医学信息文摘 2018(32)
    • [30].遗传发育所在作物基因组单碱基编辑方法研究中取得进展[J]. 蔬菜 2017(03)

    标签:;  ;  ;  ;  ;  ;  

    关于部分排序的基因组重组问题的研究
    下载Doc文档

    猜你喜欢