基因组序列CGR图形的多重分形分析及应用

基因组序列CGR图形的多重分形分析及应用

论文题目: 基因组序列CGR图形的多重分形分析及应用

论文类型: 博士论文

论文专业: 生物医学工程

作者: 符维娟

导师: 汪源源

关键词: 生物信息学,基因预测,分子进化,图形,多序列比对,基因重排,复杂度,分形,多重分形,概率集,标度不变性,广义维数谱,多重分形谱,系统树

文献来源: 复旦大学

发表年度: 2005

论文摘要: 生物信息学是运用数学、信息学、计算机科学等来阐明生物学意义的一门新兴交叉科学,近年来随着分子数据的快速增加而获得极大发展,其中包括基因预测和分子进化研究等内容的基因组序列分析是生物信息学的主要研究领域。目前已经有大量的算法和程序用于基因组序列分析,并且不断改进的分析技术也成为生物信息学发展的基础。统计方法作为一种强大的数据处理手段,在基因组序列分析中越来越受到重视。Jeffrey提出的基于迭代函数的DNA序列CGR(chaos-game representation)图形表示方法,将序列中一定长度字的分布规律表现为图形的分形特征,进而通过分形分析就可获取序列的分布规律,从而也成为基因组序列分析的一种统计方法。采用CGR图形方法表示基因组序列具有直观、不受序列长程相关性的影响、不依赖于序列尺度以及计算速度快等优点,因此可以克服目前基因组中序列分析中的一些缺陷,如基因预测程序过于依赖模型、多序列比对受基因重排和计算复杂度的限制、以及不同规模的基因组之间难以比较等。尽管CGR图形方法具有极大的应用潜力,但是一直以来都未能在生物信息学中获得广泛应用。究其原因,是因为缺乏对CGR图形分形特征的严格数学描述,现有的简单分形维数也只能从整体上定量表征CGR图形。 多重分形理论是现今分形理论研究的热点,它是通过谱函数来描述分形结构中不同层次的分形特征,并借助统计物理学的方法来讨论特征参量概率测度的分布规律。近两年已经有人提出将多重分形理论用于基因组序列CGR图形的设想,但是到目前为止尚未有具体的分析和应用。基于上述背景,本文对基因组序列CGR图形的多重分形分析进行了深入研究,并对其在生物信息学中的应用(基因预测和分子进化研究)做了初步探讨。 本文首先计算了人类基因组序列CGR图形的容量维数和信息维数,计算结果显示分形维数随着所取字长度的变化而变化,只在一定的字长度范围内保持稳定;此外分形维数在序列增加到5M后不再改变,因此就可以用5M长度的序列来概括巨大的人类基因组的统计信息。接着本文着重研究了基因组序列CGR图形的多重分形计算过程,通过比较三种概率集对标度不变性范围的影响,选取出标度不变性最好的相对概率集,并且观察到相对概率集的标度不变性随尺度变化可被分为不同的区域,这反映了基因组序列不同长度的序列片段有着不同的分布规律,再通过相对概率集可计算得到光滑的广义维数谱和多重分形谱。然后本论文对基因组序列的CGR图形方法在基因预测中的应用作了尝试,发现由多个字长度下的广义维数谱和多重分形谱组成的多重分形谱图可以更有效区分基因片

论文目录:

中文摘要

Abstract

第一章 绪论

§1.1 前言

§1.2 生物信息学的研究发展现状

§1.2.1 生物信息学的背景与现状

§1.2.2 生物信息学的主要研究内容

§1.2.3 生物序列分析软件和服务

§1.3 基因组序列的CGR图形方法及研究进展

§1.4 分形理论的研究发展现状

§1.4.1 分形理论的发展及基本问题

§1.4.2 多重分形理论的提出

§1.5 本文研究目标和组织结构

第二章 基因组序列的CGR图形表示

§2.1 分子生物学知识

§2.2 基因组序列的CGR图形表示方法

§2.2.1 基因组序列CGR图形的生成过程

§2.2.2 基因组序列CGR图形的几点讨论

§2.3 基因组序列CGR图形的分形模式比较

§2.4 其它图形方法

§2.5 结论

第三章 基因组序列CGR图形的简单分形计算

§3.1 分形维数及其计算

§3.2 分形中的标度问题

§3.3 CGR图形的几种简单分形维数计算

§3.3.1 不同长度序列CGR图形的分形维数计算和比较

§3.3.2 不同特征序列CGR图形的分形维数计算和比较

§3.4 结论

第四章 基因组序列CGR图形的多重分形计算

§4.1 CGR图形的多重分形计算

§4.1.1 多重分形的统计计算方法

§4.1.2 CGR图形的多重分形计算

§4.2 CGR图形多重分形计算中的几个问题

§4.2.1 lnXq-lnr曲线和无标度范围

§4.2.2 权重因子q的选择范围

§4.2.3 广义维数和简单维数的关系

§4.2.4 谱图的形态意义

§4.3 序列长度和字长度对CGR图形多重分形计算的影响

§4.4 结论

第五章 基于CGR图形多重分形分析的基因预测

§5.1 不同特征片断的多重分形分析谱图比较

§5.2 不同特征片断多重分形分析谱图的参数比较

§5.3 编码区含量对多重分形谱图的影响

§5.4 基于CGR图形及其多重分形分析的基因预测系统构建

§5.5 结论

第六章 基于CGR图形聚类分析的分子进化研究

§6.1 基于CGR图形及其多重分形分析的系统树建立过程

§6.1.1 聚类分析算法

§6.1.2 基于CGR图形的分子序列系统树建立和检验

§6.2 锌指蛋白基因家族的系统树建立

§6.3 基于细菌全基因组的系统树建立

§6.4 乙型肝炎病毒D基因型系统的系统树建立

§6.5 结论

第七章 讨论和展望

参考文献

致谢

附录 博士期间发表的论文

论文独创性声明

论文使用授权声明

发布时间: 2005-09-19

参考文献

  • [1].作物诊断的叶片图像多重分形方法与建模[D]. 王访.湖南农业大学2013

相关论文

  • [1].地貌与地震形变场分形与多重分形特征研究[D]. 李锰.中国地震局地球物理研究所2002
  • [2].地球化学场的分形与多重分形特征[D]. 谢淑云.中国地质大学2003
  • [3].计算智能在生物信息学中的应用研究[D]. 彭司华.浙江大学2004
  • [4].生物信息学中的序列比对算法研究[D]. 唐玉荣.中国农业大学2004
  • [5].基于变分PDE和多重分形的图像建模理论、算法与应用[D]. 肖亮.南京理工大学2004
  • [6].蛋白质二级结构预测的模型与方法研究[D]. 王勇献.国防科学技术大学2004
  • [7].生物信息数据挖掘中的若干方法及其应用研究[D]. 宋杰.大连理工大学2005
  • [8].生物信息学中多序列比对等算法的研究[D]. 张敏.大连理工大学2005
  • [9].多重分形理论及其在图象处理中应用的研究[D]. 李会方.西北工业大学2004
  • [10].基于多重分形与混沌理论的金融市场研究[D]. 吴金克.天津大学2005

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基因组序列CGR图形的多重分形分析及应用
下载Doc文档

猜你喜欢