论文摘要
基因是遗传的基本单位,是携带遗传信息的DNA片断,而非基因部分不编码蛋白质,因此,从DNA序列中预测出基因区一直是生物信息学的重要研究内容。本文运用信号处理的理论和方法,包括变换域方法、数字滤波器、时频分析、统计学习和智能算法等来研究基因预测。首先分析了基因预测滤波器的原理,提出编码区序列的长度和周期性的强弱是影响预测结果的重要因素。根据基因编码区的周期性质,设计了具有窄带选通特性的FIR数字滤波器和自适应滤波器。利用已标注的基因数据进行计算,获得了时域外显子位置的预测曲线,说明所设计的滤波器是有效的,并且能够提高基因预测的准确性。其次将基因预测的滤波器与傅立叶变换相结合,提出了一种用于基因识别的改进傅立叶方法。该方法能放大周期3信号,滤除背景噪声,不受现有傅立叶方法对于序列长度的限制。实验表明改进的傅立叶方法提高了预测精度。同时,给出一种加窗傅立叶变换的方法,可以识别出DNA序列中的编码区和非编码区。然后将基因编码区的隐马尔科夫模型与前向算法相结合,实现了对外显子的识别。对已标注的DNA序列进行预测,该算法既有效,又降低了计算量。同时,将支持向量机用于基因分类,实验表明该方法不仅提高了预测精度,而且降低了训练所需的数据。最后分别研究了四种特征量和三种判别方法对算法预测精度的影响,在此基础上,实现了一种基于多种特征量的基因识别算法,实验结果表明文中给出的算法进一步弥补了傅立叶方法的不足,对于较短的基因序列,其预测精度高于现有的基因识别算法。
论文目录
摘要Abstract第1章 绪论1.1 课题的研究背景及意义1.2 生物信息学1.2.1 生物信息学的主要研究内容1.2.2 生物信息学的前沿1.2.3 生物信息数据库1.3 基因序列的相关性研究1.4 基因预测的研究现状及分析1.4.1 基于序列同源性的基因预测研究1.4.2 基于序列统计特征的基因预测研究1.4.3 基因预测存在的问题1.5 本文工作第2章 基因预测的FIR数字滤波器研究2.1 生物学基础2.2 目前的DNA映射2.3 基因序列的周期3性质2.4 反陷波数字滤波器2.5 多级滤波器2.6 FIR带通数字滤波器2.7 仿真实验2.8 小结第3章 基因预测的自适应滤波器研究3.1 基因预测的LMS自适应滤波器3.1.1 LMS算法3.1.2 自适应滤波器设计3.1.3 仿真实验和结果分析3.2 基因预测的RLS自适应滤波器3.2.1 RLS算法3.2.2 仿真实验和结果分析3.3 基因预测的变步长LMS自适应滤波器3.3.1 固定步长LMS算法存在的问题及解决方法3.3.2 基因序列自身的生物学特点3.3.3 变步长LMS算法3.3.4 仿真实验和结果分析3.4 基因序列的时频分析3.4.1 时频分析3.4.2 仿真实验和结果分析3.5 小结第4章 基于改进傅立叶方法的基因预测研究4.1 改进的傅立叶方法4.1.1 Z曲线映射4.1.2 滤波器的选取4.1.3 改进的方法4.1.4 算法的评价4.1.5 统计判别法4.2 傅立叶变换方法的比较4.2.1 功率谱图的比较4.2.2 功率谱向量的比较4.2.3 基因识别性能的比较4.2.4 延长打乱傅立叶方法和改进傅立叶方法的比较4.2.5 加窗的傅立叶方法4.3 小结第5章 基于隐马尔科夫模型和支持向量机方法的基因预测研究5.1 生物信息学中的HMM方法5.2 隐马尔科夫模型5.2.1 隐马尔科夫模型的定义5.2.2 基因外显子的隐马尔科夫模型5.3 EM算法5.4 前向算法5.5 基于隐马尔科夫模型的EM算法5.6 仿真计算5.6.1 仿真数据5.6.2 仿真步骤5.6.3 仿真结果分析5.7 支持向量机及其在生物信息学中的应用5.7.1 支持向量机5.7.2 支持向量机在生物信息学中的应用5.8 支持向量机分类问题5.8.1 最优分离超平面5.8.2 基于支持向量机的基因序列识别研究5.9 小结第6章 基于多种特征量的基因识别算法研究6.1 常用的基因序列的特征量6.2 文中采用的几种特征量6.2.1 碱基组成成分6.2.2 密码子使用频率6.2.3 碱基位置的相关性6.2.4 周期3性质6.3 文中采用的统计学习方法6.3.1 欧氏距离法6.3.2 马氏距离法6.3.3 费歇判别法6.4 相同序列长度下各种特征量的实验研究6.4.1 实验数据6.4.2 单一特征量实验6.4.3 三种特征量实验6.4.4 四种特征量实验6.5 不同序列长度下多种特征量的实验研究6.6 小结第7章 结论与展望7.1 结论7.2 展望参考文献攻读学位期间公开发表论文攻读学位期间参与的科研项目致谢研究生履历
相关论文文献
- [1].分数傅里叶域信号处理理论与方法——专题导读[J]. 光电工程 2018(06)
- [2].傅里叶级数的起源、发展与启示[J]. 电气电子教学学报 2012(05)
- [3].小波分析去噪的应用研究[J]. 山西电子技术 2010(03)
- [4].主持人语[J]. 电力科学与技术学报 2013(01)
- [5].压缩感知理论及重构算法性能分析[J]. 信息技术 2016(03)
- [6].“信号与系统”和“数字信号处理”一体化教学探索[J]. 通化师范学院学报 2015(08)
- [7].基于压缩感知的网络信息特征研究[J]. 信息技术与信息化 2015(05)
- [8].随机数列在声散射体设计中的应用[J]. 声学技术 2013(05)
- [9].基于LabVIEW的信号处理技术应用演示及实验系统设计[J]. 实验技术与管理 2010(07)
- [10].微时代背景下的数字信号处理微课程设计[J]. 科技资讯 2014(26)
标签:生物信息学论文; 基因预测论文; 傅立叶变换论文; 滤波器论文; 隐马尔科夫模型论文; 支持向量机论文;