论文摘要
生物信息学是用来分析大量序列数据,从中提取有效信息的高效处理方法。钾离子通道是离子通道各家族中数目最多,种类最庞杂的通道之一,它对维持生物体的各项生理机能都起着至关重要的作用,并逐渐成为生物分子研究的重点领域。近年来,人们对离子通道的研究主要基于其结构与功能的角度,以氨基酸序列的角度分析则较少,而蛋白质的结构是由其氨基酸序列所决定的,所以本论文从电压门控钾离子通道的序列角度,使用生物信息学和离散增量的方法,提取有效特征参数,对电压门控钾离子通道进行分类预测,并对预测结果进行评价。本论文的工作主要有三个方面内容,第一,建立适合于本课题研究工作的电压门控钾离子通道数据库。第二,提取特征参数进行预测分类。从新建的数据库中提取电压门控钾离子通道序列信息,从整条蛋白质序列角度出发,分别把序列中短程关联信息,长程关联信息,约化组分这三类特征信息的组分含量构成离散源,应用离散增量的分类预测方法预测出各条序列蛋白的所属家族,并使用自洽检验法和留一检验法对算法进行评价,并通过敏感性,特异性和精确性这三个算法评价指标来评价预测结果的准确度,结果表明用局部N肽三联体含量作为特征参数进行分类预测,可以取得很好的效果,预测平均精度达99.12%;第三,聚类分析。基于电压门控钾离子通道数据库,从数据库中选出每个子家族的一条代表序列,计算出两两序列之间的离散增量,再把得到的离散增量距离矩阵转化为聚类树形式表现出来,得到了较好的聚类效果。
论文目录
相关论文文献
标签:电压门控钾离子通道论文; 数据库论文; 离散增量论文; 序列分析论文; 聚类论文;