基于信号处理理论和方法的基因预测研究

基于信号处理理论和方法的基因预测研究

论文摘要

基因是遗传的基本单位,是携带遗传信息的DNA片断,而非基因部分不编码蛋白质,因此,从DNA序列中预测出基因区一直是生物信息学的重要研究内容。本文运用信号处理的理论和方法,包括变换域方法、数字滤波器、时频分析、统计学习和智能算法等来研究基因预测。首先分析了基因预测滤波器的原理,提出编码区序列的长度和周期性的强弱是影响预测结果的重要因素。根据基因编码区的周期性质,设计了具有窄带选通特性的FIR数字滤波器和自适应滤波器。利用已标注的基因数据进行计算,获得了时域外显子位置的预测曲线,说明所设计的滤波器是有效的,并且能够提高基因预测的准确性。其次将基因预测的滤波器与傅立叶变换相结合,提出了一种用于基因识别的改进傅立叶方法。该方法能放大周期3信号,滤除背景噪声,不受现有傅立叶方法对于序列长度的限制。实验表明改进的傅立叶方法提高了预测精度。同时,给出一种加窗傅立叶变换的方法,可以识别出DNA序列中的编码区和非编码区。然后将基因编码区的隐马尔科夫模型与前向算法相结合,实现了对外显子的识别。对已标注的DNA序列进行预测,该算法既有效,又降低了计算量。同时,将支持向量机用于基因分类,实验表明该方法不仅提高了预测精度,而且降低了训练所需的数据。最后分别研究了四种特征量和三种判别方法对算法预测精度的影响,在此基础上,实现了一种基于多种特征量的基因识别算法,实验结果表明文中给出的算法进一步弥补了傅立叶方法的不足,对于较短的基因序列,其预测精度高于现有的基因识别算法。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的研究背景及意义
  • 1.2 生物信息学
  • 1.2.1 生物信息学的主要研究内容
  • 1.2.2 生物信息学的前沿
  • 1.2.3 生物信息数据库
  • 1.3 基因序列的相关性研究
  • 1.4 基因预测的研究现状及分析
  • 1.4.1 基于序列同源性的基因预测研究
  • 1.4.2 基于序列统计特征的基因预测研究
  • 1.4.3 基因预测存在的问题
  • 1.5 本文工作
  • 第2章 基因预测的FIR数字滤波器研究
  • 2.1 生物学基础
  • 2.2 目前的DNA映射
  • 2.3 基因序列的周期3性质
  • 2.4 反陷波数字滤波器
  • 2.5 多级滤波器
  • 2.6 FIR带通数字滤波器
  • 2.7 仿真实验
  • 2.8 小结
  • 第3章 基因预测的自适应滤波器研究
  • 3.1 基因预测的LMS自适应滤波器
  • 3.1.1 LMS算法
  • 3.1.2 自适应滤波器设计
  • 3.1.3 仿真实验和结果分析
  • 3.2 基因预测的RLS自适应滤波器
  • 3.2.1 RLS算法
  • 3.2.2 仿真实验和结果分析
  • 3.3 基因预测的变步长LMS自适应滤波器
  • 3.3.1 固定步长LMS算法存在的问题及解决方法
  • 3.3.2 基因序列自身的生物学特点
  • 3.3.3 变步长LMS算法
  • 3.3.4 仿真实验和结果分析
  • 3.4 基因序列的时频分析
  • 3.4.1 时频分析
  • 3.4.2 仿真实验和结果分析
  • 3.5 小结
  • 第4章 基于改进傅立叶方法的基因预测研究
  • 4.1 改进的傅立叶方法
  • 4.1.1 Z曲线映射
  • 4.1.2 滤波器的选取
  • 4.1.3 改进的方法
  • 4.1.4 算法的评价
  • 4.1.5 统计判别法
  • 4.2 傅立叶变换方法的比较
  • 4.2.1 功率谱图的比较
  • 4.2.2 功率谱向量的比较
  • 4.2.3 基因识别性能的比较
  • 4.2.4 延长打乱傅立叶方法和改进傅立叶方法的比较
  • 4.2.5 加窗的傅立叶方法
  • 4.3 小结
  • 第5章 基于隐马尔科夫模型和支持向量机方法的基因预测研究
  • 5.1 生物信息学中的HMM方法
  • 5.2 隐马尔科夫模型
  • 5.2.1 隐马尔科夫模型的定义
  • 5.2.2 基因外显子的隐马尔科夫模型
  • 5.3 EM算法
  • 5.4 前向算法
  • 5.5 基于隐马尔科夫模型的EM算法
  • 5.6 仿真计算
  • 5.6.1 仿真数据
  • 5.6.2 仿真步骤
  • 5.6.3 仿真结果分析
  • 5.7 支持向量机及其在生物信息学中的应用
  • 5.7.1 支持向量机
  • 5.7.2 支持向量机在生物信息学中的应用
  • 5.8 支持向量机分类问题
  • 5.8.1 最优分离超平面
  • 5.8.2 基于支持向量机的基因序列识别研究
  • 5.9 小结
  • 第6章 基于多种特征量的基因识别算法研究
  • 6.1 常用的基因序列的特征量
  • 6.2 文中采用的几种特征量
  • 6.2.1 碱基组成成分
  • 6.2.2 密码子使用频率
  • 6.2.3 碱基位置的相关性
  • 6.2.4 周期3性质
  • 6.3 文中采用的统计学习方法
  • 6.3.1 欧氏距离法
  • 6.3.2 马氏距离法
  • 6.3.3 费歇判别法
  • 6.4 相同序列长度下各种特征量的实验研究
  • 6.4.1 实验数据
  • 6.4.2 单一特征量实验
  • 6.4.3 三种特征量实验
  • 6.4.4 四种特征量实验
  • 6.5 不同序列长度下多种特征量的实验研究
  • 6.6 小结
  • 第7章 结论与展望
  • 7.1 结论
  • 7.2 展望
  • 参考文献
  • 攻读学位期间公开发表论文
  • 攻读学位期间参与的科研项目
  • 致谢
  • 研究生履历
  • 相关论文文献

    • [1].分数傅里叶域信号处理理论与方法——专题导读[J]. 光电工程 2018(06)
    • [2].傅里叶级数的起源、发展与启示[J]. 电气电子教学学报 2012(05)
    • [3].小波分析去噪的应用研究[J]. 山西电子技术 2010(03)
    • [4].主持人语[J]. 电力科学与技术学报 2013(01)
    • [5].压缩感知理论及重构算法性能分析[J]. 信息技术 2016(03)
    • [6].“信号与系统”和“数字信号处理”一体化教学探索[J]. 通化师范学院学报 2015(08)
    • [7].基于压缩感知的网络信息特征研究[J]. 信息技术与信息化 2015(05)
    • [8].随机数列在声散射体设计中的应用[J]. 声学技术 2013(05)
    • [9].基于LabVIEW的信号处理技术应用演示及实验系统设计[J]. 实验技术与管理 2010(07)
    • [10].微时代背景下的数字信号处理微课程设计[J]. 科技资讯 2014(26)

    标签:;  ;  ;  ;  ;  ;  

    基于信号处理理论和方法的基因预测研究
    下载Doc文档

    猜你喜欢