论文摘要
蛋白质组学是以系统和动态的观点研究蛋白质及其相互作用的一门新兴科学。它以样品的分离和制备技术为基础,以生物质谱技术为核心,以生物信息学为支撑,试图实现对蛋白质组高通量、全方位的定性、定量和定位研究。本论文涉及的研究工作主要集中在以下两个方面:1)蛋白质组学相关数据库的开发,数据标准的制定,功能注释体系的构建;2)大规模蛋白质磷酸化化学定量的方法学研究。本论文将对这两部分工作进行总结。第一部分介绍差异表达蛋白质数据库(DEPD)的构建和使用。比较蛋白质组学的目标是系统比较两种细胞状态(如疾病和正常状态)之间的蛋白质表达谱差异,关注由疾病或者是环境因子作用引起的蛋白质量的变化。随着定量蛋白质组学的发展,大量蛋白质差异表达数据被发表在各类非格式化文献中。尽管这些数据对于寻找生物标记物和药物靶点很有价值,但不幸的是很少有人把它们整合成格式统一的数据资源。目前国内外还没有关于差异表达蛋白质的数据库。这种现状阻碍了科学家从比较蛋白质组学的研究成果中获得可靠而有价值的信息。为此我们开发了DEPD(Differentiallyexpressed database)数据库来储存这些信息。我们人工提取了来自104篇文献的3266个差异表达蛋白质信息。所有这些蛋白质差异表达信息都附有详细的样本、外界环境以及试验方法学描述,以确保这些差异表达数据能被正确解读。为了统一“比较蛋白质组学”产出数据的格式,我们提出了比较蛋白质组学模型(CPXS 0.1)。它定义了描述一个比较蛋白质组学试验所需的最小信息需求,是DEPD的数据模型。为了方便数据查询和提交,我们设计了一个界面友好的数据库网站,提供了一系列较为完备的蛋白质功能分析工具。DEPD的所有数据都能从该网站免费下载,它的网址是http://protchem.hunnu.edu.cn/depd.第二部分主要介绍大规模蛋白质组磷酸化化学定量检测的方法学研究。蛋白质组磷酸化研究一直以来都是蛋白质组学研究的热点和难点。以往的蛋白质组磷酸化研究一般集中于1)磷酸化蛋白,肽段以及磷酸化位点的鉴定;2)磷酸激酶、磷酸酯酶与其底物之间的相互作用;3)磷酸化肽段(蛋白)的定量和动态变化的研究。而测量细胞内蛋白质磷酸化的化学定量(即磷酸化比例)却是一个被人忽视而又非常重要的科学问题。以往发表的少数关于磷酸化化学定量的研究都局限在细胞外或者少数几种磷酸化蛋白上。因此开发一种可靠的大规模确定细胞内磷酸化化学定量的方法是蛋白质组磷酸化研究走向深入的重要一环。我们以Hela细胞的细胞核和胞浆为材料,采用密度梯度离心、SDS-PAGE等方法初步富集目的蛋白,酶解后用16O水和18O水分别标记完全去除磷酸化和未经处理的两个相同细胞组分。运用Bruker UltraFlex TOF/TOF MS质谱仪,通过比较两者之间各肽段丰度的差异找到磷酸化肽段并获得其化学定量信息。为了建立这一方法,我研究了从谱图数据预处理到16O/18O定量的各个信息处理细节,开发了一个专门的数据处理软件MSExplorer.通过预备试验我们验证了这些算法和试验流程的可行性,通过反复优化后基本掌握了这种方法。在初步试验中,我们从5个SDS条带中,用LC-MALDI策略共鉴定了141个蛋白质,获得了35个磷酸化肽段的化学定量数据,其中大部分为新发现的磷酸化位点和肽段。