关于生物信息学的几个问题 ——DNA序列编码区与非编码区识别方法的研究

关于生物信息学的几个问题 ——DNA序列编码区与非编码区识别方法的研究

论文摘要

随着人类基因组计划的发展,近年来生物信息的数据呈指数增长,如何从大量的数据中挖掘出有用的生物信息是生物信息学领域今后致力解决的问题,其中基因识别问题即通过计算的方法识别DNA序列中编码蛋白质的基因更是十分迫切需要解决的研究课题之一。目前,基因识别常用的方法有:复杂度分析方法、人工神经网络方法、傅立叶分析方法和统计学方法等。概括起来,基因预测方法大致分为两类。一类是基于编码区的碱基组成和非编码区的差异;一类是基于编码区所具有的独特信号,如起始密码子、终止密码子等。本文首先介绍了生物信息学发展情况、基本概念,研究内容和研究方法。然后运用三种寻找CpG岛的方法,找到可能存在基因的位置,并在此基础上,结合一种新的DNA序列字母向量表示方法((?)14),利用信息熵β-KL离散量预测DNA序列的编码和非编码的方法,提高了识别基因编码与非编码区边界的效率,同时,拓展了W-Li阈值的定义,给出S′,通过搜索β=0,0.1,0.2,…,0.9,1,比较发现β∈(0.5,0.7)效果最好。在β=0.65时利用找Dβ-KL找到DNA序列的编码和非编码的边界准确率达到89%,高于Bernalola-Galvan提出的70%的算法,而且计算的时间有显著的减少。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 研究的背景
  • 1.2 国内外发展情况
  • 1.3 DNA序列编码区的研究
  • 1.3.1 新基因的发现与鉴定
  • 1.3.2 非编码区信息结构分析
  • 1.3.3 非编码区功能预测
  • 1.4 本文研究的主要内容
  • 1.5 本文的结构安排
  • 第二章 生物信息学
  • 2.1 生物信息学的诞生及其重要性
  • 2.2 生物信息学的定义
  • 2.3 生物信息学研究内容
  • 2.3.1 生物信息的收集、存储、管理与提供
  • 2.3.2 基因组序列信息的提取和分析
  • 2.3.3 生物大分子结构模拟和药物设计
  • 2.4 生物信息学的主要研究方法
  • 第三章 基于CpG含量分类技术预测基因区域
  • 3.1 研究CpG岛的意义
  • 3.2 CpG含量预测步骤
  • 3.3 CpG岛的预测方法
  • 3.3.1 Markov模型法
  • 3.3.2 CG频率法
  • 3.4 材料
  • 3.4.1 S值搜寻CpG岛
  • 3.4.2 滑动方法二次搜寻CpG岛
  • 3.4.3 三次搜寻CpG岛
  • 第四章 基于CpG岛和信息熵技术预测DNA序列编码区
  • 4.1 Shannon熵
  • 4.2 互熵和离散量
  • 4.2.1 互熵的定义
  • 4.2.2 Jensen-Shannon离散量
  • 4.2.3 β-KL离散量
  • 4)'>4.3 DNA序列的新向量构建方法(R4
  • 4.3.1 终止密码子的统计
  • 8与R14表示'>4.3.2 DNA序列的R8与R14表示
  • 4.4 应用实例与数据验证
  • 4.4.1 材料和方法
  • 4.4.2 进一步讨论
  • 4.5 试验结果验证
  • 第五章 总结
  • 5.1 论文的创新点
  • 5.2 展望
  • 5.3 建议
  • 致谢
  • 参考文献
  • 附录:作者在攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].航空离散量输入处理机理及设计实现[J]. 电子技术应用 2016(03)
    • [2].航空离散量输出处理机理及设计实现[J]. 电子技术应用 2016(03)
    • [3].离散量信号处理的现状及趋势[J]. 电子技术应用 2016(03)
    • [4].一种机载机电管理计算机中离散量采集系统的设计[J]. 数码世界 2020(04)
    • [5].一种基于离散量控制的软件毁钥设计方法[J]. 数码世界 2020(06)
    • [6].一种机载高可靠离散量输入输出系统设计[J]. 电子技术 2015(06)
    • [7].一种简单可靠离散量信号电路的设计和实现[J]. 电子设计工程 2013(05)
    • [8].一种机载系统离散量采集接口电路设计[J]. 信息通信 2018(04)
    • [9].基于FPGA的离散量接口控制器设计[J]. 现代电子技术 2017(20)
    • [10].一种高集成度高可靠的离散量采集电路设计[J]. 电脑知识与技术 2019(04)
    • [11].基于USB总线的离散量接口设计与实现[J]. 计算机测量与控制 2015(05)
    • [12].机载计算机内离散量接口功能的设计方法[J]. 计算机技术与发展 2015(02)
    • [13].基于CAN总线的离散量接口显控终端设计[J]. 电子技术与软件工程 2019(11)
    • [14].基于USB总线的离散量输入接口板设计与实现[J]. 测控技术 2013(04)
    • [15].β-KL离散量在识别DNA编码区域中的应用[J]. 生物信息学 2010(02)
    • [16].基于离散量和用户兴趣贴近度的协同过滤推荐算法[J]. 计算机工程 2018(01)
    • [17].一种航空机电系统通用采集接口设计方案[J]. 山西电子技术 2018(04)
    • [18].试谈离散数学多媒体教学[J]. 成功(教育) 2008(06)
    • [19].基于AXI4总线的So C中离散量信号控制IP核的设计与验证[J]. 信息通信 2020(03)
    • [20].一种基于离散量配置方案的硬件资源识别容错设计技术[J]. 航空电子技术 2019(01)
    • [21].试论“差不多”的概念意义、情态意义及相关问题[J]. 海外华文教育 2011(01)
    • [22].基于支持向量机方法预测神经毒素[J]. 内蒙古大学学报(自然科学版) 2009(03)
    • [23].关于离散量均值差和连续量均值差的几个估计[J]. 赣南师范大学学报 2018(06)
    • [24].视知觉线索对幼儿小数离散量表征的影响[J]. 心理发展与教育 2012(04)
    • [25].一种航空机电系统通用输出接口设计方案[J]. 电脑知识与技术 2019(10)
    • [26].计算机接口处理模块及其自测试设计[J]. 航空计算技术 2013(01)
    • [27].一种新型离散量接口电路的设计[J]. 计算机技术与发展 2015(03)
    • [28].用离散增量的方法识别酶蛋白[J]. 科技信息(学术研究) 2008(27)
    • [29].比字句的语法量化作用[J]. 牡丹江大学学报 2013(01)
    • [30].论《离散数学》学习方法[J]. 常州信息职业技术学院学报 2010(04)

    标签:;  ;  ;  

    关于生物信息学的几个问题 ——DNA序列编码区与非编码区识别方法的研究
    下载Doc文档

    猜你喜欢