论文摘要
生物学实验技术的快速发展,产生了海量的实验数据;计算机计算能力的不断提高,则为生物学数据的高速处理提供了崭新的研究平台,这一切都有力地推动了生物信息学的深入发展。如何从海量的生物学数据中挖掘出有用的信息并归纳出具有实际意义的科学规律是生物信息学研究的目标之一。蛋白质作为生命体中一类重要的大分子,它们之间的相互作用支撑和影响着生命体内的各种活动,如细胞的构造、细胞内重要细胞器的分化和增长、遗传信息的调节,酶的催化效应、免疫保护等。因此,了解生命体内蛋白之间的相互作用关系,有助于更好地了解生命的内在机理,为一些实际问题,如疾病的治疗,提供更好的备选方案。虽然随着实验技术的进步,得到了海量的蛋白质相互作用数据,但是生命体固有的复杂性使得现有的数据仍旧无法对生命内在的生理探索提供有力支持,那么这样一个宏大的工程似乎无法仅靠实验技术的不断提高来完成,因此基于数据分析方法(如,计算方法)则逐渐地发展成为了一个重要的辅助工具,而基于蛋白质序列信息的蛋白质相互作用预测方法则是其中的一个重要工具。目前,一般常见的研究方法是基于机器学习的,在提取出相互作用蛋白质对的特征后,利用机器学习的方法来抓取这些特征,生成预测器,从而预测未知蛋白质间的相互作用,以达到构建重要相互作用网络的目的。基于蛋白质序列信息的预测方法主要分为两个部分,特征选取和现有机器学习方法预测能力的改进,两个问题相辅相成,不过在之前的研究中大多集中在机器学习方法的改进上,而对于特征的选取则没有较深入细致的研究。在本文中,我们主要的研究内容是利用蛋白质的谱信息来获取蛋白质相互作用的特征,生成蛋白质相互作用的特征向量后,结合机器学习的方法构建蛋白质相互作用网络。本文主要分5个部分:1)从生物信息学的由来出发,到基因组学,再到蛋白质组学,从整体的角度,论述了蛋白质相互作用研究在整个生命科学中的重要意义,之后介绍了目前蛋白质相互作用的检测(从实验的角度)和预测(从计算机模拟的角度)方法,阐述了这些方法所获得的结果以及它们的优缺点。之后说明了蛋白质三个不同的层次结构和蛋白质生物学功能的关系,并列出了不同结构信息所在的数据库以及如何利用这些数据库构建用于算法设计和研究的本地数据库。2)由于不同的数据集结构(网络结构)影响机器学习算法的预测能力,特别对基于序列信息的预测方法影响更大,从前人的研究中发现基于序列信息的预测方法无法正确地学习出特定网络中(网络中有高连接度的枢纽蛋白质)的相互作用蛋白质特征。在本文的第三章,我们基于机器学习方法和平衡数据集的计算结果,阐述了不同蛋白质的局部相互作用网络有着自己的特征,在同属一个局部相互作用网络的蛋白质作用对的特征是可以被获取的,但是这样特征则会被网络中高连接度的枢纽蛋白质所覆盖掉。进一步,我们还利用关联规则的方法找出了特征可被获取的局部网络中扮演关键角色的3联码基团。3)共鸣识别模型是一个重要的蛋白质分析工具,它主要是从蛋白质的信息谱来获取蛋白质的信息。基于分子的谱信息,人们可以分析分子的性质以及分子和分子间的关系,如蛋白质活性位点的预测、蛋白质二级结构的预测、蛋白质和蛋白质、蛋白质和DNA间的相互作用预测。本文的第四章首先介绍了共鸣识别模型的基本原理和它的实现例子。由于共鸣识别模型不能显示局部信息,因而将小波变换引入其中,在阐述了小波的基本原理后,一些意义深远的应用也做了相应的介绍,也包括我们基于小波的蛋白质和蛋白质、蛋白质和DNA间的相互作用预测。4)在第五章我们利用提升小波从蛋白质序列中提取出它们相互作用的频谱特征,利用支持向量机训练学习后,预测蛋白质间相互作用。模拟计算结果表明,在阳性数据和阴性数据平衡的前提下,提升小波获取的低维蛋白质相互作用特征向量对于物理上相互作用的蛋白质可以得到较高预测精度。进一步还阐述了不同功能的蛋白质相互作用网络有着不同特征,为了得到更准确的预测结果,需要利用不同性质的蛋白质相互特征。5)蛋白质相互作用的预测目的是为了相互作用网络的建立,从建立的相互作用网络中,可以了解细胞内蛋白质相互作用网络的关系和它们所对应的生命体中各种功能的内在机理。因此,在第六章中,我们首先阐述了蛋白质相互作用网络建立的一般性方法,之后我们选取多个局部网络,分别利用局部网络中的相互作用蛋白质对集合计算出它们的3频肽特征或提升小波所提取的特征,结合机器学习的方法建立对应它们性质的预测分类模型,然后再从数据库中选取一些重要蛋白质组成的待预测数据进行预测,并对预测结果绘制相互作用网络图。
论文目录
相关论文文献
- [1].浅谈森林对环境的相互作用及影响[J]. 农民致富之友 2019(14)
- [2].多酚类化合物与必需微量元素的相互作用[J]. 卫生研究 2019(06)
- [3].基于多标记学习预测药物-靶标相互作用[J]. 计算机工程与应用 2017(15)
- [4].根据实例浅析生物与环境之间的相互作用及其重要性[J]. 智富时代 2019(01)
- [5].高中物理“相互作用”的教学重难点分析[J]. 考试周刊 2015(86)
- [6].基于一致性学习预测药物-靶标相互作用[J]. 湖南工业大学学报 2020(06)
- [7].少林的文化担当[J]. 少林与太极 2018(07)
- [8].美国“相互作用大学”及启示[J]. 黑龙江高教研究 2010(02)
- [9].药物与饮食相互作用[J]. 中国乡村医药 2008(09)
- [10].土与结构物相互作用的数值模拟研究综述[J]. 山东工业技术 2016(13)
- [11].谈音乐和旅游的关系及相互作用[J]. 大众文艺 2015(20)
- [12].微观对相互作用[J]. 中国原子能科学研究院年报 2010(00)
- [13].五阶非线性对啁啾超短脉冲间相互作用的影响[J]. 应用光学 2013(04)
- [14].浅谈药物的相互作用[J]. 大家健康(学术版) 2013(19)
- [15].非线性土—结动力相互作用的时域子结构分析[J]. 福建工程学院学报 2010(03)
- [16].相互作用·本质契合与规律生成——兼与鲁品越教授商榷[J]. 哲学动态 2008(10)
- [17].蛋白质-适配体相互作用预测的方法[J]. 医学信息 2020(10)
- [18].茶多酚与多糖的相互作用:作用机理及功能特性变化研究进展[J]. 茶叶科学 2019(02)
- [19].相得益彰:表观修饰的相互作用(英文)[J]. Science Bulletin 2015(10)
- [20].高中物理“相互作用”的学习重难点分析[J]. 同行 2016(14)
- [21].酵母双杂交系统在痘病毒与宿主相互作用中的研究进展[J]. 中国人兽共患病学报 2013(09)
- [22].涡模式的相互作用网[J]. 广西物理 2010(03)
- [23].从生活现象谈物理中的相互作用[J]. 才智 2019(18)
- [24].解读服饰时尚与音乐潮流的关系[J]. 文化产业 2018(21)
- [25].相互作用的各种统一和新的相互作用[J]. 商丘师范学院学报 2018(03)
- [26].临床药师参与1例华法林与曲马多产生相互作用的病例分析[J]. 药学研究 2017(06)
- [27].校地相互作用及其制度逻辑——以美国加州州立大学为例[J]. 比较教育研究 2015(12)
- [28].暗物质之间或正在发生未知相互作用[J]. 前沿科学 2015(02)
- [29].再现生活“原形” 品析物理“原味”——谈“相互作用”复习[J]. 高中数理化 2014(Z2)
- [30].《相互作用》易错问题辨析[J]. 中学生数理化(高一版) 2013(10)