论文摘要
本文是关于蛋白质分子的模拟计算,由两部分组成:一是计算蛋白质分子自然构象;一是蛋白质二级结构预测。对第一部分,提出了基于王朝更替策略的遗传算法来搜索蛋白质分子的自然构象。二维toy模型是一种简化的蛋白质折叠的模型。随着环境的变化,一个王朝不能经久不衰,受这个的启发提出了王朝更替策略。这个方法解决可能的早熟问题。为了测试这个方法,计算了蛋白质1AGT和1AHO,得到能量最小值分别为-20.8296、-21.0853,而这在文献中得到的最好结果是-19.6169和-15.1911,我们的值比文献中的值低了6-38%。因此相信对应我们的最小自由能的构象是自然构象。在本文的第二部分,提出了基于氨基酸短序列的统计方法,用于预测蛋白质二级结构。这是对基于单个氨基酸的传统统计方法的延伸。本文进行了大量的计算以确定最优短序列长度的选取,发现用3、4、5、6个氨基酸的短序列最好。对于测试蛋白质组126 protein set、396 protein set、2180 protein set,得到的Q3二级结构预测准确度分别为89.9%、88.8%、89.2%,SOV准确度分别为84.3%、82.4%、84.1%。然后我们分析了新的蛋白质组153 protein set,这组蛋白质在PDB数据库中的发布日期晚于2007-11-15。对这组新的蛋白质,本文计算结果的准确度Q3=73.7%、SOV=68.2%,好于常用的GORⅣ、GORⅤ、JPred这3个预测方法的平均结果Q3=69.7%、sov=66.9%。从计算结果看来所提出的短序列统计方法是一个很有希望的蛋白质二级结构预测方法。随着已知蛋白质结构数据量的增加,这个方法的效果会更好。
论文目录
相关论文文献
标签:蛋白质自然构象论文; 蛋白质二级结构预测论文; 氨基酸短序列论文; 王朝更替遗传算法论文; 模型论文;