基因组中最大唯一匹配的查找算法研究

基因组中最大唯一匹配的查找算法研究

论文摘要

最大唯一匹配在基因序列比对中有着重要的作用。它可以从相互重叠的序列片断中重构DNA的完整序列,可在各种试验条件下从探测数据中决定物理和基因图存贮,可遍历和比较数据库中的DNA序列来判断两个或多个序列的相似性。本文首先简单介绍了国内外现有的部分研究成果,并在详细介绍后缀树和后缀数组的基础上,给出了一种基于后缀数组的最大唯一匹配(Maximal Unique Matches简写为MUM)查找及其排序的方法。算法首先构造出两条基因序列的后缀数组,然后通过两两比较后缀数组中相邻的后缀获得相邻后缀的最长公共前缀(Longest Common Prefixes简写为LCP)值,然后通过扫描满足MUM条件的LCP值求出MUM,最后利用最长递增子序列(Longest Increasing Subsequences简写为LIS)算法对获得的MUM进行排序。测试结果表明,在同等规模的数据量下,基于后缀数组的算法相比基于后缀树的算法在空间上具有显著优势,基于后缀数组的MUM查找及其排序方法可以节省28%的空间。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 背景介绍
  • 1.2 研究现状
  • 1.3 论文工作
  • 第二章 后缀树
  • 2.1 后缀树简介
  • 2.2 后缀树的构造算法
  • 2.2.1 构造后缀树的朴素算法
  • 2.2.2 构造后缀树的Ukkonen算法
  • 2.3 后缀树中的字符串匹配问题
  • 2.4 本章小结
  • 第三章 后缀数组
  • 3.1 后缀数组简介
  • 3.2 后缀数组构造算法
  • 3.2.1 后缀数组的构造
  • 3.2.2 查找LCP
  • 3.3 本章小结
  • 第四章 全基因序列比对
  • 4.1 相关介绍
  • 4.2 后缀树和后缀数组的联系
  • 4.3 查找MUM
  • 4.3.1 利用后缀树查找MUM
  • 4.3.2 利用后缀数组查找MUM
  • 4.4 MUM的排序
  • 4.4.1 LIS问题描述
  • 4.4.2 LIS算法的动态规划求解
  • 4.4.3 改进的LIS算法
  • 4.5 实验结果分析
  • 4.5.1 实验环境
  • 4.5.2 实验数据
  • 4.5.3 实验结果
  • 4.6 结论
  • 4.7 本章小结
  • 第五章 总结与展望
  • 致谢
  • 参考文献
  • 研究成果
  • 相关论文文献

    • [1].后缀“—??”派生词的构成及其释义之分析[J]. 中国朝鲜语文 2020(01)
    • [2].浅析宜城方言后缀“娃儿”[J]. 开封教育学院学报 2017(01)
    • [3].语法视域下后缀“子”的功能意义探究[J]. 兰州教育学院学报 2017(03)
    • [4].四川方言后缀“子”浅谈[J]. 现代语文(语言研究版) 2015(01)
    • [5].汉语方言里的双后缀[J]. 语言研究集刊 2017(02)
    • [6].神通广大的“后缀”[J]. 阅读 2011(04)
    • [7].表达式转换及求值探析[J]. 安顺学院学报 2020(01)
    • [8].四川南充方言称谓语后缀“子”探析[J]. 重庆科技学院学报(社会科学版) 2017(08)
    • [9].一种基于后缀排序快速实现Burrows-Wheeler变换的方法[J]. 电子与信息学报 2015(02)
    • [10].后缀“子”[J]. 考试周刊 2012(70)
    • [11].巧用单词的后缀[J]. 高中生 2011(30)
    • [12].重庆方言的后缀“头”[J]. 品位经典 2020(03)
    • [13].后缀“头”的虚化考察[J]. 宁夏大学学报(人文社会科学版) 2019(Z1)
    • [14].一种将中缀表达式转换为后缀表达式的新方法[J]. 成都大学学报(自然科学版) 2008(01)
    • [15].东台方言的后缀“儿”和“儿+子”[J]. 中国语文 2014(03)
    • [16].话痨[J]. 英语画刊(高级版) 2016(05)
    • [17].俄语带指小表爱后缀表物名词理据性浅析[J]. 考试周刊 2013(17)
    • [18].吉安市赣方言“哩”后缀使用情况的社会语言学分析[J]. 南京理工大学学报(社会科学版) 2011(04)
    • [19].后缀-кa的构词类型及其语义特点[J]. 俄语学习 2009(06)
    • [20].书面满语元音异常交替后缀的音系学解释[J]. 民族语文 2009(06)
    • [21].后缀元音对辅音/s/声学时长变化的影响[J]. 听力学及言语疾病杂志 2015(01)
    • [22].汉语方言中的“崽”后缀[J]. 长沙大学学报 2009(06)
    • [23].西夏语谓词人称后缀补议[J]. 语言科学 2008(05)
    • [24].西夏语的双数后缀[J]. 西夏研究 2019(04)
    • [25].后缀-able的用法小议[J]. 英语知识 2009(03)
    • [26].小议汉语后缀“化”及其英译[J]. 广西职业技术学院学报 2009(02)
    • [27].论中缀表达式与后缀表达式的转换[J]. 现代商贸工业 2008(06)
    • [28].常见的外文作者姓氏前、后缀及书写形式[J]. 中华肩肘外科电子杂志 2017(03)
    • [29].英汉施事后缀对比分析(英文)[J]. 语文学刊(外语教育教学) 2015(04)
    • [30].韩国语后缀“-?”(者)系列人物指称语的形态及语义特征分析[J]. 语文学刊(外语教育教学) 2015(11)

    标签:;  ;  

    基因组中最大唯一匹配的查找算法研究
    下载Doc文档

    猜你喜欢