论文摘要
当前,生命医学研究正处于后基因组时代。系统地分析和全面理解蛋白质之间通过相互作用完成生命活动的规律成为最热的研究问题之一。特别是,从大规模蛋白质相互作用网络中识别蛋白质复合物对预测蛋白质功能、解释特定的生物进程具有重要意义。针对算法CPM应用于蛋白质相互作用网络时,蛋白质复合物识别准确率不高等缺陷,我们通过引入距离限制条件约束蛋白质复合物的规模,进而提出了基于团渗透和距离限制的蛋白质复合物识别参数算法CPM-DR与非参数算法CP-DR。基于酵母蛋白质相互作用网络平台的实验结果表明,CPM-DR和CP-DR都比CPM能够更准确、更有效、更全面的识别出具有特定生物意义的蛋白质复合物。针对传统的基于密度的局部搜索方法忽略了边缘蛋白质结点、稀疏的真实蛋白质复合物、没有考虑蛋白质对生命活动的基本差异等缺陷,提出了基于关键蛋白质和局部适应的蛋白质复合物识别算法EPOF,并将其应用到加权和非加权的酵母蛋白质相互作用网络。实验结果表明,EPOF相比于其他算法具有更好的性能。此外,EPOF能够识别具有生物意义的低密度蛋白质复合物。更进一步,EPOF验证了关键蛋白质在蛋白质复合物识别研究中具有极其重要的作用。针对蛋白质相互作用的动态性、可利用的蛋白质相互作用数据的不完全性和存在噪声等众多问题,通过融合组织特异性的基因表达数据和人类静态蛋白质相互作用网络,提出了基于组织特异性和局部适应的蛋白质复合物识别算法TSOF。将TSOF应用到人类静态蛋白质相互作用网络的实验结果表明,TSOF识别的蛋白质复合物具有很强的生物意义。此外,TSOF验证了组织特异性蛋白质相互作用在蛋白质复合物识别研究中具有极其重要的作用。本文提出的几个蛋白质复合物识别算法从不同角度出发,有效地解决了蛋白质相互作用网络聚类过程中存在的一些问题,识别的蛋白质复合物从统计意义上被证明是有生物意义的,对生物实验具有积极的指导意义。
论文目录
摘要ABSTRACT第一章 绪论1.1 蛋白质相互作用网络1.2 课题研究的意义1.3 本文的主要研究内容1.4 论文的结构第二章 蛋白质复合物挖掘相关研究2.1 传统的蛋白质复合物挖掘研究2.1.1 基于图划分的方法2.1.2 基于层次聚类的方法2.1.3 基于密度的局部搜索方法2.1.4 其他方法2.2 融合多元数据的蛋白质复合物挖掘研究2.2.1 融合基因表达数据的蛋白质复合物挖掘2.2.2 融合其他多元信息的蛋白质复合物挖掘2.3 基于蛋白质复合物挖掘的扩展研究2.4 蛋白质复合物挖掘研究的新技术2.5 本章小结第三章 基于团渗透和距离限制的蛋白质复合物识别算法3.1 CPM算法分析3.2 基于团渗透和距离限制的蛋白质复合物识别参数算法CPM-DR3.2.1 CPM-DR模型3.2.2 算法CPM-DR3.3 基于团渗透和距离限制的蛋白质复合物识别非参数算法CP-DR3.3.1 CP-DR模型3.3.2 算法CP-DR3.4 实验结果与分析3.4.1 与MIPS数据库中的已知蛋白质复合物比较3.4.2 算法的特异性、敏感度和综合评价3.4.3 功能富集性分析3.4.4 重叠率分析3.5 本章小结第四章 基于关键蛋白质和局部适应的蛋白质复合物识别算法4.1 基于关键蛋白质和局部适应的蛋白质复合物模型4.2 种子结点选择4.3 算法EPOF4.4 实验结果与分析4.4.1 与已知蛋白质复合物比较4.4.2 算法敏感度和特异性4.4.3 功能富集性分析4.4.4 算法精度分析4.4.5 蛋白质复合物密度分析4.4.6 交叠率分析4.4.7 种子有效性验证4.4.8 加权蛋白质网络实验结果比较分析4.5 本章小结第五章 基于组织特异性和局部适应的蛋白质复合物识别算法5.1 组织特异性子网构建5.2 基于组织特异性和局部适应的蛋白质复合物模型5.3 算法TSOF5.4 实验结果与分析5.4.1 实验数据5.4.2 功能富集性分析5.4.3 算法精度分析5.4.4 种子有效性验证5.5 本章小结第六章 总结6.1 研究贡献与创新点6.2 研究展望参考文献致谢攻读硕士学位期间主要研究成果
相关论文文献
标签:系统生物学论文; 蛋白质相互作用网络论文; 聚类算法论文; 蛋白质复合物论文;