RNA二级结构预测方法研究

RNA二级结构预测方法研究

论文摘要

随着对RNA(Ribonucleic Acid)研究的逐步深入,RNA在进行、遗传过程中的重要作用也越来越显著。RNA分子不仅充当着生物细胞中遗传信息的载体,还具有一系列重要的功能,如催化RNA剪接,加工和修饰RNA前体,调控基因表达等,这也促使了人们对RNA功能进行深入研究。而RNA的功能与结构是密切相关的,因此,通过研究RNA的二级结构,进而深入挖掘、阐述其功能就成为分子生物学中的重要研究课题。由于使用传统的实验手段(如X射线晶体衍射和核磁共振)去测定RNA的晶体结构虽然比较精确可靠,但代价昂贵,且费时费力。所以,借助于计算机实现的各种算法对RNA二级结构进行预测就成为当前国内外公认的主要方法。RNA二级结构预测方法经过近30年的研究,到目前为止,已经有众多的算法。这些算法有的已经非常成熟,例如最小自由能算法,其预测精确度有时能达到90 %以上,但是它不能预测RNA假结。而目前的众多其它预测算法也大都各自存在着问题,如时间复杂度高,对序列的长度有限制等等。因此,对RNA二级结构预测方法的研究仍然是RNA研究中的重点课题。本文正是在这种环境下,对RNA二级结构预测方法进行深入研究。论文对目前的RNA二级结构预测方法进行了分析、总结,然后归纳为四类:(1)比较序列分析方法(2)动态规划算法(3)组合优化算法(4)启发式算法。通过对这四类方法的研究、分析、比较,论文找到了新的预测方法的研究思路,为本文工作的完成奠定了坚实的理论基础。首先,本文研究了马尔可夫链在RNA二级结构预测中的应用,提出了基于马尔可夫链的RNA二级结构预测新方法。根据自由能,构建马尔可夫链的转移概率矩阵,进而构建RNA-ML,来寻找自由能最小的RNA二级结构。论文从公用数据库(Genomic tRNA Database)中选取六条tRNA序列进行预测,将其预测结果和目前著名软件Mfold和RNAStructure的预测结果进行比较。实验结果表明,本文建立的RNA-ML优于Mfold,对于单条序列与RNAstructure接近。同时,本方法降低了时间复杂度,提高了敏感性和特异性,对trna序列执行起来速度较快,也可以应用于较长的RNA序列,弥补了大部分方法的预测时间随着序列长度增加成立方甚至四次方增长的缺陷。其次,本文研究了隐马尔可夫模型在RNA二级结构预测中的应用,提出了基于隐马尔可夫模型的RNA二级结构预测新方法。以最小自由能为基础,建立各茎区间的转移概率矩阵、观察值概率矩阵,进而构建RNA-HMM,来寻找自由能最小的RNA二级结构。论文选取PseudoBase中的6条结构相对较复杂的RNA序列进行预测,将其预测结果和pknotsRG软件预测结果进行比较。实验结果表明,本方法的结果准确率比pknotsRG有所提高,通用性比较好。同时,也缩短了预测时间,提高了敏感性和特异性。最后,本文研究了粒子群算法在RNA二级结构预测中的应用,提出了基于粒子群算法的RNA二级结构预测方法。结合PSO、最小自由能、被选择茎区的数量和平均长度,本文设计了一个新的适应度函数,建立了IPSO。论文分别用RNAPredict,H-Helix PSO和IPSO进行RNA二级结构预测,进而来比较它们RNA二级结构的自由能。结果表明,用IPSO方法预测到的最优茎区组合的自由能低于其它方法,能够找到更为稳定的二级结构,对于长序列IPSO的性能优势更为显著,而且具有较快的收敛速度,通过较少的迭代就可以找到更好的二级结构。论文又将标准粒子群优化算法(SPSO)、标准遗传算法(SGA)、蚁群算法(ACO)和IPSO方法的预测结果进行了比较。结果表明,由于高效的目标函数,IPSO的性能明显高于其它三种方法。为了验证IPSO方法在RNA二级结构预测中的有效性,本文将IPSO、Mfold和RnaPredict的预测结果进行了比较。结果表明:IPSO在其中三条序列上的敏感性和特异性高于Mfold,而在其余两个序列的测试结果低于Mfold,IPSO方法的在全部序列上的敏感性和特异性均高于RnaPredict,这也证明了本文所设计的目标函数是可行的、更有效的。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 研究背景与意义
  • 1.3 国内外研究现状
  • 1.4 本文组织与结构
  • 1.5 本章小结
  • 第2章 RNA 相关理论
  • 2.1 RNA 基本知识
  • 2.1.1 RNA 的构成
  • 2.1.2 RNA 的分类与功能
  • 2.1.3 RNA 的结构特征
  • 2.2 RNA 二级结构
  • 2.2.1 RNA 二级结构的基本单元
  • 2.2.2 RNA 二级结构的表示方法
  • 2.3 RNA 的假结结构
  • 2.4 RNA 的数据库资源
  • 2.5 本章小结
  • 第3章 RNA 二级结构预测方法的比较与分析
  • 3.1 引言
  • 3.2 比较序列分析方法
  • 3.2.1 共变模型
  • 3.2.2 随机上下文无关语法模型
  • 3.3 动态规划算法
  • 3.3.1 碱基最大配对方法
  • 3.3.2 最小自由能方法
  • 3.4 组合优化算法
  • 3.4.1 螺旋区堆积法
  • 3.4.2 最大权重匹配算法
  • 3.5 启发式算法
  • 3.5.1 遗传算法
  • 3.5.2 模拟退火算法
  • 3.5.3 神经网络算法
  • 3.6 本章小结
  • 第4章 基于马尔可夫链的RNA 二级结构预测方法
  • 4.1 马尔可夫模型
  • 4.1.1 马尔可夫理论产生的历史背景
  • 4.1.2 马尔可夫链的应用综述
  • 4.1.3 马尔可夫模型的相关定义
  • 4.2 RNA 茎区生成算法-前后缀匹配算法
  • 4.2.1 相关定义
  • 4.2.2 算法描述
  • 4.2.3 算法流程图
  • 4.2.4 茎区生成算法实例
  • 4.3 基于马尔可夫链的RNA 二级结构预测方法——RNA-ML
  • 4.3.1 RNA-ML
  • 4.3.2 算法流程
  • 4.3.4 实验结果
  • 4.4 本章小结
  • 第5章 基于隐马尔可夫模型的RNA 二级结构预测新方法
  • 5.1 引言
  • 5.2 隐马尔可夫模型(HMM)
  • 5.2.1 HMM 的相关概念
  • 5.2.2 HMM 建模的三个关键问题
  • 5.3 基于HMM 的RNA 二级结构预测新方法(RNA-HMM)
  • 5.3.1 RNA-HMM
  • 5.3.2 算法流程
  • 5.3.3 实验结果
  • 5.4 本章小结
  • 第6章 基于粒子群算法的RNA 二级结构预测新方法
  • 6.1 粒子群算法
  • 6.1.1 粒子群算法的相关理论
  • 6.1.2 算法参数设置
  • 6.2 IPSO 的实现
  • 6.2.1 适应度函数的定义
  • 6.2.2 位置更新
  • 6.2.3 系统参数设置
  • 6.2.4 算法流程
  • 6.3 实验结果与讨论
  • 6.3.1 数据集
  • 6.3.2 实验设置
  • 6.3.3 实验结果
  • 6.3.4 结果讨论
  • 6.4 本章小结
  • 第7章 总结与展望
  • 7.1 论文总结
  • 7.2 存在的问题及展望
  • 参考文献
  • 攻读学位期间发表的学术论文及取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].一种新的RNA二级结构三维图形表示及其应用[J]. 生物信息学 2017(01)
    • [2].RNA二级结构的数学表示及其应用[J]. 大连交通大学学报 2010(06)
    • [3].RNA二级结构的一种新的图形表示及其应用[J]. 中国海洋大学学报(自然科学版) 2009(02)
    • [4].RNA二级结构分析方法及在植物系统学研究上的应用[J]. 九江学院学报 2008(03)
    • [5].我国揭示RNA二级结构剪接调控新机制[J]. 生物学教学 2014(01)
    • [6].基于启发式算法预测含假结RNA二级结构的研究进展[J]. 生物信息学 2011(02)
    • [7].基于局部茎搜索的RNA二级结构预测算法[J]. 生物化学与生物物理进展 2009(01)
    • [8].RNA二级结构在分子系统学中的应用[J]. 应用预防医学 2008(05)
    • [9].研究揭示RNA二级结构剪接调控新机制[J]. 中国家禽 2013(16)
    • [10].一种基于RNA二级结构的信息隐藏方案[J]. 郑州轻工业学院学报(自然科学版) 2014(01)
    • [11].基于动态规划RNA二级结构的比较[J]. 吉林大学学报(工学版) 2011(S2)
    • [12].核糖体RNA二级结构对拓扑结构准确性的影响(英文)[J]. 菌物学报 2011(06)
    • [13].HIV-1 RNA基因组二级结构被确定[J]. 广西科学 2009(03)
    • [14].含假结RNA二级结构类的图语法[J]. 计算机工程与应用 2008(02)
    • [15].RNA二级结构的2D图形表示及相似性分析[J]. 世界科技研究与发展 2010(05)
    • [16].应用符号动力学原理实现RNA二级结构的相似性分析[J]. 计算机研究与发展 2013(02)
    • [17].基于茎区的自由能算法预测RNA二级结构[J]. 微计算机信息 2009(09)
    • [18].图论在RNA二级结构中的应用[J]. 生物信息学 2008(03)
    • [19].mRNA翻译起始区二级结构优化提高(R)-羰基还原酶的表达及催化效率[J]. 生物工程学报 2009(12)
    • [20].我国在国际上首次破解染色体二级结构[J]. 生物学教学 2014(10)
    • [21].拟南芥细胞核中RNA-蛋白相互作用与RNA二级结构呈负相关关系[J]. 中国肿瘤生物治疗杂志 2015(06)
    • [22].破解遗传物质二级结构[J]. 科学世界 2014(06)
    • [23].曲克芦丁对牛血清白蛋白溶液二级结构影响的研究[J]. 药物分析杂志 2011(01)
    • [24].一种新的RNA二级结构特征序列表示及相似性分析[J]. 计算机应用研究 2011(03)
    • [25].猪瘟病毒3′非编码区的多态性及其二级结构分析[J]. 中国农业科学 2010(04)
    • [26].基于茎区组合的RNA二级结构预测算法[J]. 计算机应用 2010(06)
    • [27].再生丝素二级结构的研究现状及发展趋势[J]. 现代丝绸科学与技术 2018(01)
    • [28].核酸二级结构的渐进式教学设计[J]. 化学教育 2016(16)
    • [29].一种可扩展半径的RNA二级结构密度聚类算法[J]. 小型微型计算机系统 2015(09)
    • [30].蛋白质中三联氨基酸数与二级结构数的模型研究[J]. 厦门大学学报(自然科学版) 2009(05)

    标签:;  ;  ;  ;  

    RNA二级结构预测方法研究
    下载Doc文档

    猜你喜欢