论文摘要
目的:本论文的研究目的是提出和实施了以下两个思路,提高预测蛋白质结构的准确率和效率:1.在应用3-状态隐马尔可夫模型(Hidden Markov Model,HMM)预测蛋白质二级结构的基础上,提出和建立了7-状态和15-状态的优化HMM;进而提出通过序列谱的HMM(sequence-profile-based HMM)将优化的HMM与BP神经网络(Back Propagation Neural Network,BPNN)相结合的预测方法,提高蛋白质二级结构预测的准确率。2.综合蛋白质二级结构信息和蛋白质同源序列信息,进行蛋白质折叠预测中的二硫键预测,减少蛋白质三维结构预测中的蛋白质构象的搜索空间,提高预测的效率。方法:应用优化HMM的预测对象是从Cuff和Barton所建立的CB513数据集合中筛选出的492条已知蛋白质二级结构的蛋白质序列,共82272个氨基酸残基。将其随机分为7组,每组平均的α螺旋(H),β折叠(E),无规卷曲(C)分布分别为35%,23%和42%。分别应用7-状态和15-状态HMM以及BPNN-HMM混合模型,对以上的蛋白质序列进行二级结构预测,对预测的准确率进行7-交叉验证,并将各类方法的预测结果进行分析和比较。二硫键预测研究的对象是从SWISS-PROT数据库中筛选的252条蛋白质序列,选取的每条蛋白质序列链内含有的二硫键个数至少为2个,至多为5个。首先对数据集中形成二硫键的半胱氨酸以及周围的局部氨基酸残基,在蛋白质二级结构形成的使用偏性进行统计分析,进而综合蛋白质二级结构信息和蛋白质序列的位置特异性得分矩阵(Position-Specific Scoring Matrix,PSSM),共同作为预测模型的输入编码进行二硫键配对连接的预测,然后对预测准确率进行4-交交叉验证,并将预测结果进行分析和比较。结果:应用7-状态HMM,在492条蛋白质序列上的7-交叉验证结果中,预测的整体准确率Q3比应用3-状态HMM提高了3.11%,三态片断重叠准确率SOV提高了6.15%,三态各自准确率中的QE提高明显,为6.49%;应用15-状态HMM,整体准确率Q3比应用7-状态HMM提高了0.18%,SOV准确率提高了1.8%,三态各自准确率中的QE提高了5.74%;在15-状态HMM基础上加入序列的同源信息后,Q3准确率比单序列15-状态HMM提高了8.36%,SOV准确率提高了8.2%,三态各自准确率QH,QE,QC分别提高了10.8%,15.8%,3.9%。应用15-状态HMM与BPNN相结合的混合模型,预测的整体准确率Q3比典型的两个BPNN的串联模型提高了1.11%,SOV准确率提高了1.69%,三态各自准确率QH,QE,QC分别提高了1.3%,1.02%,4.6%。二硫键配对连接的预测中,在相同BPNN结构下(窗口宽度=15,隐含层个数=50),252条蛋白质序列上的4-交叉验证结果中,加入蛋白质二级结构信息后的预测敏感性Sn比未加入蛋白质二级结构信息前提高了3.06%,特异性Sp提高了0.69%,相关系数Mcc提高0.041,总体二硫键配对预测准确率Qc提高了1.1%,总体蛋白质预测准确率Qp提高了2.78%。结论:1.7-状态HMM预测蛋白质二级结构的性能优于3-状态HMM,15-状态HMM总体预测性能和7-状态HMM相当,但对β折叠预测能力好;在15-状态HMM基础上加入序列同源信息后,预测性能更好。2.应用BPNN和HMM的混合模型预测蛋白质二级结构,比典型的两个BPNN的串联模型预测准确率高。3.在BPNN的基础上,综合蛋白质序列的PSSM矩阵和蛋白质二级结构信息进行蛋白质空间结构中的二硫键配对连接的预测,方法是可行且有效的。
论文目录
相关论文文献
- [1].蛋白质二级结构指定[J]. 生物信息学 2016(03)
- [2].蛋白质二级结构在线服务器预测评估[J]. 生物信息学 2019(01)
- [3].表面增强拉曼光谱对于蛋白质二级结构的酰胺Ⅲ谱带表征(英文)[J]. Chinese Journal of Chemical Physics 2019(05)
- [4].蛋白质二级结构预测的一种新的编码方式[J]. 工业控制计算机 2015(04)
- [5].蛋白质二级结构预测的多核学习方法[J]. 计算机应用 2013(S1)
- [6].蛋白质和变性蛋白质二级结构的FTIR分析进展[J]. 化学研究与应用 2012(08)
- [7].基于遗传算法的蛋白质二级结构预测方法研究进展[J]. 农机化研究 2009(05)
- [8].基于混合并行遗传算法的蛋白质二级结构预测[J]. 农机化研究 2009(06)
- [9].不同贮藏条件对鸡蛋蛋白质二级结构的影响[J]. 黑龙江畜牧兽医 2019(02)
- [10].蛋白质二级结构预测的一种新的编码方式[J]. 计算机工程与应用 2011(18)
- [11].基于级联神经网络的蛋白质二级结构预测[J]. 计算机工程 2010(04)
- [12].蛋白质二级结构预测的结构表达方法研究[J]. 河南师范大学学报(自然科学版) 2009(06)
- [13].蛋白质二级结构预测方法研究[J]. 计算机工程与应用 2009(36)
- [14].基于神经网络的蛋白质二级结构预测[J]. 济南大学学报(自然科学版) 2008(02)
- [15].基于蛋白质二级结构序列的结构型预测[J]. 河北理工大学学报(自然科学版) 2008(03)
- [16].蛋白质二级结构的二维红外相关光谱模拟研究[J]. 光散射学报 2013(04)
- [17].蛋白质二级结构预测方法的评价[J]. 生物信息学 2010(03)
- [18].基于深度学习的八类蛋白质二级结构预测算法[J]. 计算机应用 2017(05)
- [19].傅里叶红外光谱法研究肌肉蛋白质的二级结构[J]. 食品与发酵工业 2015(10)
- [20].蛋白质二级结构预测方法初探[J]. 生物技术世界 2014(11)
- [21].杨树蛋白质二级结构的人工神经网络预测[J]. 西北林学院学报 2014(05)
- [22].糟蛋减压加工过程中蛋黄蛋白质二级结构的变化研究[J]. 现代食品科技 2013(06)
- [23].基于多模集成神经网络的蛋白质二级结构预测[J]. 四川理工学院学报(自然科学版) 2011(06)
- [24].基于条件随机场进行蛋白质二级结构预测[J]. 计算机应用研究 2009(03)
- [25].基于多度量学习方法的蛋白质二级结构预测[J]. 智能计算机与应用 2014(05)
- [26].基于复合金字塔模型的蛋白质二级结构预测系统[J]. 科学通报 2009(21)
- [27].基于红外光谱法的古代丝织品蛋白质二级结构变化分析[J]. 现代丝绸科学与技术 2011(05)
- [28].网格中基于结构分类和位矩阵编码并行遗传算法的蛋白质二级结构预测[J]. 科学技术与工程 2008(05)
- [29].储藏微环境对小麦蛋白质二级结构影响[J]. 粮食与油脂 2014(01)
- [30].基于并行粒子群优化算法的蛋白质二级结构预测[J]. 周口师范学院学报 2014(05)
标签:蛋白质二级结构预测论文; 状态隐马尔可夫模型论文; 神经网络论文; 二硫键预测论文;