生物序列的内在性质

生物序列的内在性质

论文摘要

生物信息学是多学科的交叉产物,以计算机为工具对生物信息进行存储、检索和分析。本论文主要研究了生物序列可视化、比对以及蛋白质序列网络等有关问题。从混沌游走中得到启发,引入CGR(Chaos Game Representation)的概念,定义了蛋白质混沌游走表示法(PCGR, Chaos game representation of protein)。针对蛋白质序列的多重分形性质及其Rényi熵率进行进一步研究。数学领域中的分形理论和信息论中的熵率概念被引入到蛋白质序列的分析中:把20种氨基酸以看作符号序列,由混沌游走表示的二维可视化延伸到n维空间中,用分形维数来体现蛋白质序列的性质;另外,蛋白质序列也可以被看作一组信号,可以用信息熵的概念来进行刻画。然后把多重分形维数和符号序列的Rényi熵率之间通过概率测度μ建立对应关系。氨基酸按照不同的性质进行分类,其分类的依据和偏重不同,分类结果也不同。文中介绍了两种分类:根据HP模型分为4类和依照理化性质分为7类,结合提出的一种新的比对算法,把分类过的两条蛋白质序列进行比对。利用蛋白质序列的PCGR距离,给定阈值k,迅速判断相同片段的长度及所在位置,降低了计算复杂度也可以保证比对效率,还可以根据比对结果判断序列的相似性。另外结合分层聚类法,利用FCGR(Frequency matrices extracted from CGRs)距离和二次偏差距离分别构造了26种生物的种系发生树。不同的距离定义、相同的数据,得到不同的种系树,可以探讨物种之间的进化关系。每个结点表示一段DNA片段,每一条连线都包含着片段之间的连接信息。通过复杂网络研究生物体的拓扑结构,主要通过测量聚类系数构建网络的拓扑结构。结果表明所构建的复杂网络的度分布呈现幂率性质,但是其幂率指数过小,这说明了DNA序列有着稳定的结构,但是在遗传过程中却存在大量的随机性和不稳定性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 背景介绍
  • 1.2 研究的目的与意义
  • 1.3 国内外研究状况
  • 1.4 研究的主要内容
  • 第二章 基因序列的可视化方法
  • 2.1 CGR 综述
  • 2.2 混沌游走
  • 2.3 CGR 的构造与迭代函数
  • 2.3.1 CGR 的性质
  • 2.4 CGR 基因签名
  • 2.4.1 基因签名介绍
  • 2.4.2 CGR 的频率矩阵——FCGR
  • 2.5 k 串理论的介绍
  • 第三章 蛋白质序列的多重分形性质及其 Rényi 熵率
  • 3.1 蛋白质CGR 的简述
  • 3.2 符号序列的几何表示
  • 3.3 符号序列的信息熵
  • 3.4 符号序列的分形表示
  • 3.5 符号动力系统描述
  • 3.6 本章小节
  • 第四章 基于蛋白质混沌游走表示法的线粒体蛋白质序列比对
  • 4.1 问题描述
  • 4.2 序列比对算法的设计
  • 4.2.1 氨基酸分类
  • 4.2.2 序列比对算法
  • 4.3 结果
  • 4.3.1 氨基酸分成4 类情况下的比对
  • 4.3.2 氨基酸分成7 类情况下的比对
  • 4.3.3 无分类情况下的比对
  • 4.4 本章小节
  • 第五章 种系分析
  • 5.1 种系分析介绍
  • 5.2 利用PCGR 距离进行种系分析
  • 5.2.1 距离概率矩阵
  • 5.2.2 结合分层聚类法生成种系树
  • 5.3 二次偏差距离
  • 5.3.1 k 阶 FCGR 归一化
  • 5.3.2 两条DNA 序列归一化k 阶FCGR 之间的二次偏差距离
  • 5.3.3 二次偏差距离的评价
  • 5.4 本章小节
  • 第六章 生物序列的网络性质
  • 6.1 DNA 序列的网络模型建模
  • 6.2 结果
  • 6.3 本章小节
  • 第七章 总结和展望
  • 7.1 总结
  • 7.2 展望
  • 致谢
  • 参考文献
  • 附录:攻读硕士学位期间发表学术论文情况
  • 相关论文文献

    • [1].蛋白质序列与蛋白质结构关系的研究[J]. 河南教育学院学报(自然科学版) 2017(04)
    • [2].基于小波分析的蛋白质序列分形研究[J]. 科技信息 2009(33)
    • [3].基于数据挖掘的蛋白质序列分析研究[J]. 信息技术与信息化 2017(06)
    • [4].利用蛋白质序列模式识别改善谷氨酸棒杆菌基因组注释[J]. 工业微生物 2014(03)
    • [5].一种新的蛋白质序列二维图形表示方法及应用[J]. 绥化学院学报 2013(11)
    • [6].蛋白质序列基于k-字的数值刻画及应用[J]. 浙江农业学报 2014(06)
    • [7].蛋白质序列图形变换及其相似性聚类分析[J]. 生命科学研究 2018(03)
    • [8].粒计算理论下的进化树建模与应用探讨[J]. 白城师范学院学报 2019(10)
    • [9].蛋白质序列的矩阵图谱表达[J]. 生命科学研究 2011(02)
    • [10].对称蛋白质序列与结构关系研究[J]. 生命科学 2010(11)
    • [11].蛋白质序列的一类新的图形表示[J]. 黑龙江生态工程职业学院学报 2008(06)
    • [12].甲型流感病毒蛋白质序列的长记忆模型[J]. 江南大学学报(自然科学版) 2012(06)
    • [13].蛋白质序列的特征周期研究[J]. 生物物理学报 2008(02)
    • [14].基于功率谱的蛋白质序列特征提取新方法[J]. 食品与生物技术学报 2018(11)
    • [15].AI背景下蛋白质序列音乐研究[J]. 艺术教育 2019(06)
    • [16].基于矩阵图谱表达法的蛋白质序列的相似性分析[J]. 计算机工程与应用 2011(07)
    • [17].DNA和蛋白质序列数据分析工具(第三版)[J]. 新疆农业科学 2012(07)
    • [18].甲型流感病毒HA蛋白质序列的预测[J]. 食品与生物技术学报 2013(08)
    • [19].P53基因蛋白质序列的相似性及其聚类分析[J]. 计算机与应用化学 2013(09)
    • [20].蛋白质序列在频率域上的一种特征提取方法[J]. 南京工业大学学报(自然科学版) 2013(06)
    • [21].基于加权决策树的蛋白质序列分类算法研究[J]. 计算机与数字工程 2012(05)
    • [22].蛋白质序列的图形表示及相似性分析[J]. 浙江农业学报 2010(05)
    • [23].一种新的蛋白质结构类预测方法[J]. 生物信息学 2012(04)
    • [24].荣昌猪SLA-DQB基因β1结构域突变分析及蛋白质序列模式预测[J]. 畜牧兽医学报 2012(08)
    • [25].基于TIGA_S4VM改进算法的蛋白质序列识别方法[J]. 山东大学学报(工学版) 2014(01)
    • [26].基于密码子特征的蛋白质序列图形表示[J]. 浙江理工大学学报(自然科学版) 2018(04)
    • [27].不同特征描述下H1N1病毒血凝素蛋白序列的比较分析[J]. 生命科学研究 2016(02)
    • [28].基于一种新的伪氨酸组成预测蛋白质折叠速率[J]. 大连交通大学学报 2015(03)
    • [29].基于极限学习机的蛋白质相互作用预测[J]. 枣庄学院学报 2017(05)
    • [30].一种基于最优局部信息融合的蛋白质亚细胞定位预测方法[J]. 中山大学学报(自然科学版) 2008(06)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    生物序列的内在性质
    下载Doc文档

    猜你喜欢