用加强的后缀数组查找MUM

用加强的后缀数组查找MUM

论文摘要

自第一个使用鸟枪法成功地完成流感嗜血杆菌完整的基因组测序以来,基因组被完全测序的物种数量每年都在飞速增长。当两个非常相近物种的完整基因组可以获得的时候,首要的问题是如何比较和注释这些基因组。对此,传统的序列比对算法已不能胜任这一工作。因此,人们提出了许多新的用于比对基因组规模序列的方法。MUMmer是最重要的用于比对整基因组序列的系统之一,它所采用的基于锚的方法以及使用后缀树查找潜在锚的算法被越来越多的基因组规模比对程序所采用。因此,在本文的开始,首先对整基因组比对系统MUMmer的算法、整体结构和系统的演化进行了分析,这为系统的改进以及提出新的基于锚的基因组规模的序列比对方法提供了参考依据。由于可获得的计算资源的限制以及所要处理序列数据规模的日益增长,尽管后缀树的构造以及查找最大唯一匹配(MUM)算法的时间和空间复杂度都是线性的,但其空间花费依然是个很大的问题。鉴于此,本文决定使用加强的后缀数组来替代后缀树查找两基因组间的MUM。本文实现了两个基于加强的后缀数组查找MUM的算法,它们分别基于加强的后缀数组的性质和对后缀树的工作方式的模拟,与对应的基于后缀树的方法具有相同的时间复杂度,实验表明它们比相应的基于后缀树的方法有更大的空间节省。此外,在使用加强的后缀数组模拟后缀树的流匹配算法的过程中,提出了一个新的为后缀数组添加后缀链的线性算法,并证明了算法的正确性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 本文的主要工作
  • 第二章 整基因组比对
  • 2.1 背景
  • 2.2 MUMmer的产生
  • 2.3 MUMmer的系统演化
  • 2.3.1 MUM的定义
  • 2.3.2 MUMmer1
  • 2.3.3 MUMmer2
  • 2.3.4 MUMmer3
  • 2.4 总结
  • 第三章 加强的后缀数组
  • 3.1 概述
  • 3.2 基本定义
  • 3.3 后缀数组基本信息的计算
  • 3.3.1 后缀数组的构造
  • 3.3.2 线性时间的lcp计算
  • 3.4 后缀数组的lcp-interval树
  • 3.4.1 lcp interval
  • 3.4.2 lcp-interval树
  • 3.5 自顶向下遍历
  • 3.5.1 child表的构造
  • 3.5.2 以常量的时间确定孩子interval
  • 3.5.3 一个例子:怎样确定串P在串S中的出现
  • 3.6 加入后缀链
  • 3.6.1 后缀链
  • 3.6.2 一个简单的后缀链表的构造算法
  • 3.7 实现细节
  • 3.7.1 lcp表
  • 3.7.2 child表
  • 3.7.3 后缀链表
  • 第四章 用加强的后缀数组替换后缀树查找MUM
  • 4.1 概述
  • 4.2 基于加强的后缀数组性质计算MUM的算法
  • 4.2.1 查找两基因组间的MUM
  • 4.2.2 查找多个基因组间的MUM
  • 4.3 基于加强的后缀数组的流匹配算法
  • 4.3.1 一个线性时间的后缀链interval的构造算法
  • 4.3.2 计算MUM的流匹配算法
  • 4.4 实验结果及分析
  • 第五章 结束语
  • 致谢
  • 参考文献
  • 研究成果
  • 相关论文文献

    • [1].后缀“—??”派生词的构成及其释义之分析[J]. 中国朝鲜语文 2020(01)
    • [2].浅析宜城方言后缀“娃儿”[J]. 开封教育学院学报 2017(01)
    • [3].语法视域下后缀“子”的功能意义探究[J]. 兰州教育学院学报 2017(03)
    • [4].四川方言后缀“子”浅谈[J]. 现代语文(语言研究版) 2015(01)
    • [5].汉语方言里的双后缀[J]. 语言研究集刊 2017(02)
    • [6].神通广大的“后缀”[J]. 阅读 2011(04)
    • [7].表达式转换及求值探析[J]. 安顺学院学报 2020(01)
    • [8].四川南充方言称谓语后缀“子”探析[J]. 重庆科技学院学报(社会科学版) 2017(08)
    • [9].一种基于后缀排序快速实现Burrows-Wheeler变换的方法[J]. 电子与信息学报 2015(02)
    • [10].后缀“子”[J]. 考试周刊 2012(70)
    • [11].巧用单词的后缀[J]. 高中生 2011(30)
    • [12].重庆方言的后缀“头”[J]. 品位经典 2020(03)
    • [13].后缀“头”的虚化考察[J]. 宁夏大学学报(人文社会科学版) 2019(Z1)
    • [14].一种将中缀表达式转换为后缀表达式的新方法[J]. 成都大学学报(自然科学版) 2008(01)
    • [15].东台方言的后缀“儿”和“儿+子”[J]. 中国语文 2014(03)
    • [16].话痨[J]. 英语画刊(高级版) 2016(05)
    • [17].俄语带指小表爱后缀表物名词理据性浅析[J]. 考试周刊 2013(17)
    • [18].吉安市赣方言“哩”后缀使用情况的社会语言学分析[J]. 南京理工大学学报(社会科学版) 2011(04)
    • [19].后缀-кa的构词类型及其语义特点[J]. 俄语学习 2009(06)
    • [20].书面满语元音异常交替后缀的音系学解释[J]. 民族语文 2009(06)
    • [21].后缀元音对辅音/s/声学时长变化的影响[J]. 听力学及言语疾病杂志 2015(01)
    • [22].汉语方言中的“崽”后缀[J]. 长沙大学学报 2009(06)
    • [23].西夏语谓词人称后缀补议[J]. 语言科学 2008(05)
    • [24].西夏语的双数后缀[J]. 西夏研究 2019(04)
    • [25].后缀-able的用法小议[J]. 英语知识 2009(03)
    • [26].小议汉语后缀“化”及其英译[J]. 广西职业技术学院学报 2009(02)
    • [27].论中缀表达式与后缀表达式的转换[J]. 现代商贸工业 2008(06)
    • [28].常见的外文作者姓氏前、后缀及书写形式[J]. 中华肩肘外科电子杂志 2017(03)
    • [29].英汉施事后缀对比分析(英文)[J]. 语文学刊(外语教育教学) 2015(04)
    • [30].韩国语后缀“-?”(者)系列人物指称语的形态及语义特征分析[J]. 语文学刊(外语教育教学) 2015(11)

    标签:;  ;  ;  ;  ;  

    用加强的后缀数组查找MUM
    下载Doc文档

    猜你喜欢