蛋白质结构可设计性的研究、蛋白质结构类及人类PolⅡ启动子的预测

蛋白质结构可设计性的研究、蛋白质结构类及人类PolⅡ启动子的预测

论文摘要

本文的工作主要包括以下三个部分:首先,我们研究蛋白质结构的可设计性(designability).基于对蛋白质结构空间的随机取样以及序列空间的普通有偏取样(common biased sampling, CBS),利用6种网格模型(4×4,5×5,6×6正方形网格, 3×3×3立方体网格, 2+3+4+3+2,4+5+6+5+4三角形网格)、三种不同大小的字母集(HP、HNUP与20个字母)以及两种能量函数,我们计算了蛋白质结构的可设计性.然后定义并计算了三个量:稳定性(stability),可折叠性(foldability)以及可分数(partnum),这些量被用于解释蛋白质结构的可设计性.我们发现:无论是采用什么类型的网格模型、哪种字母集以及能量函数,都有高可设计性结构的出现;对于考虑的所有情形,局部作用降低了蛋白质序列的退化率(degeneracy rate),并使可设计性变高;可设计性对于网格类型,字母集以及能量函数是敏感的;与随机取样方法相比, CBS与MetropolisMonte Carlo取样方法都使得可设计性变高;可设计性与稳定性、可折叠性的相关系数在大多数情况都大于0.5,这表明他们之间有很强的的线性关联关系,但是可设计性与可分数的线性关联关系并没有这么强,因为可分数是独立于能量的[1].其次,我们讨论四种蛋白质结构类(即α,β,α+β和α/β)的聚类分析.我们把Schneider与Wrede疏水性尺度以及蛋白质6-字母模型用于大蛋白质二级结构类的分类.由这两种类型的数据,我们构造了的两种测度,并用两种形式的重分形分析对它们进行了分析.通过计算,我们得到9个参数,并用它们来构建参数空间.每个蛋白质都由这些空间中的一个点来表示,我们提出了在这些空间中通过α,β,α+β与α/β结构类分类蛋白质的步骤. Fisher区分算法被用于评价所用的49个大蛋白质聚类的准确率,数值结果表明区分准确率比较高.特别地,在一个三维空间中,由{β,α+β,α/β}蛋白质分出α蛋白质的准确率达100.00%以及84.21%;在另一个三维空间中,由{α+β,α/β}蛋白质分出β蛋白质的准确率达92.86%以及86.96%;在最后一个三维空间中,由α/β蛋白质分出α+β蛋白质的准确率达91.67%以及83.33% [2].最后,我们预测人类Pol II启动子,主要是对启动子与非启动子序列进行区分.在此,非启动子序列是由外显子(Exon)与内含子(Intron)序列共同组成的.我们一共用到四种方法:两种形式的重分形分析方法对二核苷酸自由能序列的分析, Z曲线(Z curve)以及全局描述(global descriptor)方法对启动子与非启动子序列的分析.由这些方法我们一共得到141个参数,它们被分成七组,并用于构建一些空间,然后每个启动子与非启动子序列都由相应空间中的一个点表示.基于Fisher区分算法,在测试完这七组参数的所有120种组合后,我们发现:利用较少的参数(96以及117),得到了较满意的区分效果.特别地,在117个参数的情形下,训练集与测试集上的准确率分别达到90.43%与89.79%.与其它五种方法比较,我们的方法较好.用全局描述方法(36个参数),人类22号染色体上的18个由实验证实的启动子有17个被正确识别[3].

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 生物信息学的概念
  • 1.2 生物信息学的研究目标和任务
  • 1.3 生物信息学的主要意义和展望
  • 第二章 蛋白质可设计性与网格模型各种结构特征之间的关系
  • 2.1 引言
  • 2.2 方法与模型
  • 2.3 结果与讨论
  • 2.4 结论
  • 第三章 基于6- 字母模型、氨基酸疏水性尺度以及多重分形分析基础上大蛋白质结构的聚类
  • 3.1 引言
  • 3.2 模型与方法
  • 3.3 数据、结果与讨论
  • 3.4 结论
  • 第四章 基于初级序列与二核苷酸自由能的人类Pol II 启动子预测
  • 4.1 引言
  • 4.2 数据集
  • 4.3 方法
  • 4.4 结果与讨论
  • 4.5 与现有方法的比较
  • 4.6 结论
  • 第五章 结论和展望
  • 参考文献
  • 致谢
  • 附录 攻读硕士学位期间已公开发表或待发表的论文
  • 相关论文文献

    • [1].甘肃省新报告的117例16~25岁人类免疫缺陷病毒1型感染者pol区基因分型及耐药分析[J]. 中国病毒病杂志 2020(05)
    • [2].慢性粒细胞白血病患者血清中内源性逆转录病毒pol基因检测与分析[J]. 中国病原生物学杂志 2014(08)
    • [3].提高大众意见领袖(POL)干预效果的探索[J]. 健康教育与健康促进 2013(02)
    • [4].靶向pol基因siRNA抑制J亚型禽白血病病毒复制的研究[J]. 中国预防兽医学报 2011(05)
    • [5].不结球白菜Pol胞质雄性不育花酵母双杂交cDNA文库的构建及筛选[J]. 南京农业大学学报 2015(01)
    • [6].基于序列特征的人类Pol Ⅱ启动子理论预测[J]. 生命科学研究 2009(05)
    • [7].仿沙蚁POL-神经元的偏振信息检测方法的研究[J]. 仪器仪表学报 2008(04)
    • [8].浅析智慧园区全光局域网POL系统解决方案[J]. 数字传媒研究 2020(05)
    • [9].浅析智慧园区全光局域网POL系统解决方案[J]. 通信与信息技术 2020(03)
    • [10].基于沙蚁POL-神经元模型的航向角处理方法[J]. 光电工程 2013(10)
    • [11].RNAi沉默polβ基因部分逆转食管鳞癌细胞顺铂耐药性[J]. 第二军医大学学报 2014(03)
    • [12].柳州市60株HIV毒株pol区亚型分布和原发性耐药情况[J]. 医学动物防制 2010(09)
    • [13].仿生POL神经元的偏振光导航传感器研究[J]. 传感器与微系统 2011(09)
    • [14].无源光局域网(POL)电气工程设计要点[J]. 智能建筑电气技术 2019(06)
    • [15].宁夏地区艾滋病患者感染HIV-1病毒pol区基因变异性研究[J]. 宁夏医科大学学报 2017(07)
    • [16].猫白血病病毒的检测及pol基因遗传进化分析[J]. 动物医学进展 2020(07)
    • [17].南海钙质海绵一新记录种——白银拟族海绵Uteopsis argentea(Poléjaeff,1883)[J]. 海洋与湖沼 2020(01)
    • [18].江苏省HIV-1流行株env和pol基因亚型及其系统分析[J]. 新医学 2012(04)
    • [19].POL无源光纤局域网在智能建筑中的优势及应用[J]. 智能建筑 2020(07)
    • [20].Polι在膀胱尿路上皮癌细胞株及肿瘤组织中mRNA的表达[J]. 第三军医大学学报 2008(14)
    • [21].浅谈POL方案在南水北调中线工程的应用前景[J]. 水电站机电技术 2019(04)
    • [22].靶向GST-π、polβ基因的siRNA重组慢病毒对人食管鳞癌顺铂耐药逆转的体内实验研究[J]. 中国医疗前沿 2013(15)
    • [23].POL推动企业局域网络技术变革[J]. 通讯世界 2017(11)
    • [24].联合铂类的化疗方案在晚期食管癌中的临床评价及Polι对铂类化疗药物敏感性的影响[J]. 肿瘤学杂志 2015(02)
    • [25].猴泡沫病毒SFV-1前病毒pol基因克隆及序列分析[J]. 四川动物 2009(04)
    • [26].大功率、可扩展、封装占板面积很小、产生热量更少的POL稳压器[J]. 电源世界 2018(01)
    • [27].食管癌EC-1细胞株polβ启动子突变性转录活性分析[J]. 中国公共卫生 2011(02)
    • [28].不结球白菜Pol胞质雄性不育系和保持系蕾期基因的差异表达[J]. 西北植物学报 2010(08)
    • [29].智慧园区POL全光网络解决方案[J]. 中国新通信 2020(09)
    • [30].升特推出4A易用稳压器件 扩展其POL稳压器平台[J]. 电子与电脑 2011(01)

    标签:;  ;  ;  ;  ;  ;  ;  

    蛋白质结构可设计性的研究、蛋白质结构类及人类PolⅡ启动子的预测
    下载Doc文档

    猜你喜欢