新一代则序技术中的短序列比对和组装算法

新一代则序技术中的短序列比对和组装算法

论文摘要

新一代测序技术产生的序列片段普遍在35bp~75bp且数据量巨大,原来的序列比对和组装软件不适合这么短的序列,这就给序列比对和序列组装提出了新的挑战。本文主要探讨了新一代测序技术中的短序列比对和短序列组装算法。主要工作如下:(1)深入分析了基于哈希表的短序列比对算法ELAND、MAQ、SOAP以及基于BWT的短序列比对算法BOWTIE、BWA、SOAP2,对它们的原理及具体实现步骤进行了详细的解释,最后从模拟数据和实验数据两个方面对它们的性能进行了比较,从实验结果看基于BWT的算法在时间上与空间上一般优于基于哈希表的算法,MAQ算法虽然运行时间比基于BWT的时间要长,但是其内存使用率较低,SOAP算法是所有算法中对内存要求最高的算法。(2)对短序列组装算法进行了分类归纳,对SSAKE、VCAKE、VELVET短序列组装算法的原理和实现也做了深入的分析,并使用乳酸菌基因组对它们的性能进行了比较。从实验结果看,VELVET算法的拼接性能最好,其次是VCAKE,而SSAKE运行的时间较长。(3)然后提出一种新的基于分块索引的比对算法,算法也是基于BWT,它采用对BWT分块索引压缩的方式,并在内存中建立缓冲区,按照最久不用的原则将最久不用的块调出,以减少内存的占用。从实验结果看,当算法的缓冲区越大的时候,执行速度越快,优与MAQ算法,当缓冲区越小的时候,执行时间较长,但内存使用明显低于BOWTIE等算法。(4)最后对SOAP比对算法提出了一些改进,将短序列分为A,B,C三段,使内存使用率降低,加快了比对速度。并通过实验与SOAP算法做了比较,其内存使用率和运行速度均优于SOAP算法。

论文目录

  • 摘要
  • ABSTRACT
  • 1. 引言
  • 1.1 研究的目的和意义
  • 1.2 研究现状
  • 1.3 论文的结构安排
  • 2. 短序列比对算法
  • 2.1 基于哈希表的短序列比对算法
  • 2.1.1 Eland算法
  • 2.1.2 MAQ算法
  • 2.1.3 soap算法
  • 2.2 基于BWT的比对算法
  • 2.2.1 BWT转换压缩原理
  • 2.2.2 Bowtie算法
  • 2.2.3 bwa算法
  • 2.2.4 SOAP2算法
  • 2.3 比对算法性能分析与比较
  • 3. 短序列组装
  • 3.1 基于Overlap/Layout/Consensus的组装算法
  • 3.2 基于图的贪婪组装算法
  • 3.3 基于de Bruijn Graph算法
  • 3.3.1 de bruijn图结构
  • 3.3.2 Velvet算法
  • 3.4 组装算法性能分析与比较
  • 4. 算法改进
  • 4.1 基于块索引的短序列比对算法
  • 4.1.1 算法描述
  • 4.1.2 算法性能分析
  • 4.2 SOAP算法改进
  • 5 结论与讨论
  • 参考文献
  • 附录 攻读学位期间发表的论文
  • 相关论文文献

    • [1].双序列比对算法的研究与改进[J]. 电子技术与软件工程 2017(18)
    • [2].基于蚁群算法的双序列比对及其实现[J]. 电子技术与软件工程 2018(01)
    • [3].基于局部序列比对的漏洞挖掘技术研究[J]. 微型机与应用 2017(03)
    • [4].基于布尔逻辑的双序列比对协处理器的设计与实现[J]. 西北工业大学学报 2011(01)
    • [5].生物信息学中的序列比对算法[J]. 电脑知识与技术 2008(01)
    • [6].参数序列比对算法研究(英文)[J]. 生物信息学 2008(02)
    • [7].生物序列比对算法的研究现状[J]. 中国科技信息 2011(09)
    • [8].蛋白质序列比对算法在众核结构上的并行优化[J]. 软件学报 2010(12)
    • [9].基于混合行为的蚁群双序列比对方法[J]. 计算机工程与应用 2009(11)
    • [10].双序列比对的算法研究[J]. 计算机工程与应用 2008(36)
    • [11].BLAST序列比对脱机移植研究[J]. 内蒙古师范大学学报(自然科学汉文版) 2020(04)
    • [12].基于动态规划的基因双序列比对研究[J]. 现代计算机(专业版) 2017(32)
    • [13].多重序列比对的模型与算法[J]. 才智 2010(14)
    • [14].异构机群系统中序列比对并行算法进展[J]. 福建电脑 2019(04)
    • [15].四种常用的生物序列比对软件比较[J]. 生物信息学 2016(01)
    • [16].两种带约束的序列比对算法[J]. 江南大学学报(自然科学版) 2009(06)
    • [17].生物信息学双序列比对算法加速器设计与实现[J]. 计算机科学与探索 2008(05)
    • [18].双兔傍地走,安能辨雄雌——双序列比对工具介绍[J]. 高校生物学教学研究(电子版) 2016(01)
    • [19].始发保优的序列比对[J]. 小型微型计算机系统 2020(05)
    • [20].基于序列比对的勒索病毒同源性分析[J]. 计算机与现代化 2018(02)
    • [21].最优搜索机制下寻找最优插入-删除种子[J]. 电子科技大学学报 2011(02)
    • [22].启发式序列比对算法种子长度及其灵敏度研究[J]. 计算机技术与发展 2013(02)
    • [23].基于区域过滤的测序序列比对算法研究[J]. 信息技术与网络安全 2018(04)
    • [24].基于序列比对的行人过街风险识别研究[J]. 交通运输系统工程与信息 2018(03)
    • [25].基于大规模序列比对软件的并行优化方案[J]. 计算机工程 2009(03)
    • [26].基于动态规划的双序列比对算法构件设计与实现[J]. 计算机研究与发展 2019(09)
    • [27].一种基于低频种子的三代测序序列比对方法[J]. 计算机工程与科学 2019(09)
    • [28].DNA双序列比对问题的算法[J]. 计算机系统应用 2015(09)
    • [29].基于序列比对算法的地质剖面图自动生成[J]. 铁道勘测与设计 2010(05)
    • [30].面向OpenCL架构的大规模生物序列比对[J]. 小型微型计算机系统 2012(02)

    标签:;  ;  ;  

    新一代则序技术中的短序列比对和组装算法
    下载Doc文档

    猜你喜欢