Structural Modeling and Characterization of Protein Interaction Network

Structural Modeling and Characterization of Protein Interaction Network

论文题目: Structural Modeling and Characterization of Protein Interaction Network

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 张法

导师: 刘志勇

关键词: 序列聚类,蛋白质蛋白质相互作用,比较建模,蛋白质对接,蛋白质相互作用网络

文献来源: 中国科学院研究生院(计算技术研究所)

发表年度: 2005

论文摘要: 一、论文的研究意义随着人类基因组计划的完成以及Structural Genomics Initiative的进展,海量的序列和结构数据被持续,快速的积累,从而为生物信息学的进一步发展提供了数据保障。当前该领域的研究工作主要集中在如何对这些海量的生物数据进行分析,从序列和结构的角度拼接出蛋白质相互作用网络。由于绝大部分基因的功能是通过多个基因相互作用所形成的蛋白质合成体(complex)来表达的,而且蛋白质合成体几乎承担了所有的生物功能活动,其中包括:生物信号的传递、分子的循环控制、基因表达以及新陈代谢等等,因此蛋白质相互作用被认为是系统生物学的核心。为此我们需要确定那些蛋白质是直接相互作用的、这些相互作用的蛋白质的对接(docking)区域在那里以及这些蛋白质所构成的合成体是如何体现相应的生物功能,如何构成生物进化路径(pathway)的。随着各种高吞吐量(high-throughput)的生物试验和计算策略的进展,我们可以对分子内的所有蛋白质进行结构和功能的描述,因此使得从系统水平建模和描述蛋白质相互作用成为可能。而该研究对阐明生物物种的进化途径,解释人类疾病的复杂机理以及药物设计靶点的筛选等问题提供了理论的支持,同时具有较强的应用价值。二、论文的研究内容和组织结构本论文的研究内容是从结构的角度,通过在进化过程中相对保守,并且相互作用的结构域(domain)来描述蛋白质的相互作用。为此我们首先基于序列相似性的比较对生物序列数据进行了同源(homologous)聚类,同时我们归纳合并了所有已知的酵母和果蝇的蛋白质相互作用数据,对其进行评估,提炼出高可信的相互作用数据。我们的聚类技术和评估策略可以应用于其它生物物种的聚类分析和相互作用的评估。因为生物系统在蛋白质相互作用网络方面是保守的,即从序列到结构,进而到相互作用网络都存在着某种生物共性,这种共性或者一致性(universality)通常可以描述为一种模式保守的蛋白质相互作用网络,而该网络的基本构成单元就是蛋白质结构域。由于当前蛋白质相互作用数据主要来自序列的相互作用,每条蛋白质序列可能含有多条保守的结构域,这样相互作用的可能性就会成指数级的增长,使得寻找某一相关的相互作用变得异常困难。因此需要到找一种确定结构域之间相互作用的途径。为此我们对蛋白质序列进行了结构域的划分和映射,并采用机器学习的方法提取出结构域之间的相互作用。考虑到当前只有一小部分结构域具有三维结构信息,我们在论文中提出了一种系统的预测同源结构的方法。特别是我们构建了基于结构域聚类的模板数据库,提高了模板的涵盖范围。另外我们提出了一种以模板的三维结构比对作为profile或者anchor的比对算法,有效的提高了未知序列同相应模板之间的比对准确性,进而提高了预测结构的质量。数据分析显示,我们的方法可以是现有的同源建模(Homology Modeling)算法预

论文目录:

Abstract

摘要

Contents

Chapter 1 Introduction

1.1 Computational Biology Data Source

1.1.1 Nucleotide Sequence Databases

1.1.2 Protein Sequence Databases

1.1.3 Protein Domain & Family Databases

1.1.4 Structure- Based Databases

1.2 Protein Sequence Clustering

1.2.1 The Problems of Protein Sequence Clustering

1.2.2 Existing Methods of Protein Sequence Clustering

1.3 Comparative Modeling

1.3.1 Protein Structure Prediction

1.3.2 Stages in Comparative Modeling Process

1.4 Prediction of Protein-Protein Interaction

1.4.1 Evolutionary Traces in Protein-Protein Interaction

1.4.2 Prediction of Interacting Regions

1.4.3 Prediction of Interacting Proteins

Chapter 2 Clustering Orthologs Based on Sequence and Domain Similarities

2.1 Introduction

2.2 Previous Works

2.2.1 The Database of Orthologous Clusters

2.2.2 Related Methods for Clustering of Orthologous Groups

2.3 Materials and Methods

2.3.1 Sequence Data and Alignment Score Refinements

2.3.2 Clustering

2.3.3 Validation of Clusters

2.4 Results

2.5 Conclusion

Chapter 3 The Integration of Protein Interaction Information

3.1 Background

3.2 Materials and Methods

3.2.1 Datasets

3.2.2 Interaction Confidence Score

3.2.3 Optimization by Evolutionary Strategy

3.3 Results and Discussions

3.3.1 Validation of Confidence Scores

3.3.2 Yeast Gene-Gene Interaction Network Is Scale-Free

3.3.3 Assessment of the Reliability of Method

3.4 Conclusion

Chapte14 Comparative Modeling Based on Sequence-Conserved Domains

4.1 Introduction

4.2 Progresses and Remaining Problems in Comparative Modeling

4.2.1 Sequence Similarity

4.2.2 Template Recognition

4.2.3 The alignment in Comparative Modeling

4.2.4 The Modeling

4.3 Experimental Design

4.3.1 Template Library of Structural Clusters for Sequence-Conserved Domains

4.3.2 Structure-Anchored Alignment

4.3.3 Benchmark Selection and Validation

4.4 Results and Discussions

4.4.1 Structure Information of the Templates Library

4.4.2 Comparison of Results Predicted Using Different Alignment Protocols

4.5 Conclusion

Chapter 5 Structure-Based Assembly of Protein Interaction Network

5.1 Background

5.2 Methods and Materials

5.2.1 Overview of the Methodology

5.2.2 Datasets of Protein Interactions and Predicted Domain Structures

5.2.3 Building a Domain-Domain Interaction Map

5.2.4 Inferring Biological Consistence of the Homologous Complexes

5.3 Results and Discussion

5.3.1 the Characterized Domain-Domain Interaction

5.3.2 Validation the Method Using a Structure-Known Complex as Benchmark

5.3.3 Demonstration the Consistencies of Domain-Domain Docking

Chapter 6 Conclusion

6.1 the Significance of This Study

6.2 Overall Goal and Results

6.3 Future Works

Appendix A Parallel Bio-Sequence Comparison based on Smith-Waterman Algorithm

A1 Introduction

A2 The Smith-Waterman Algorithm

A2.1 Pair-Wise sequence Alignment

A2.2 Smith-Waterman Algorithm

A3 Parallel Pair-Wire Alignment Algorithm Based on Smith-Waterman Algorithm

A3.1 The PSW-DC Algorithm

A3.2 The C&E Method

A4. Experimental Results

A5. Conclusion and Further Work

Reference

Resume

Acknowledgements

发布时间: 2006-12-27

参考文献

  • [1].蛋白质相互作用位点及亚细胞定位预测研究[D]. 刘光徽.南京理工大学2017
  • [2].蛋白质相互作用网络中复合物识别算法研究[D]. 于杨.哈尔滨工业大学2014
  • [3].大规模信号网络的结构属性分析和自动重建[D]. 刘伟.国防科学技术大学2008
  • [4].流形学习算法及其应用研究[D]. 雷迎科.中国科学技术大学2011
  • [5].基于智能计算的生物网络构建算法的研究[D]. 赵亚欧.山东大学2015
  • [6].蛋白质相互作用数据整合与网络模块研究[D]. 唐海琳.国防科学技术大学2015
  • [7].蛋白质功能预测的非同源性计算方法研究[D]. 马志强.吉林大学2009
  • [8].基于蛋白质网络的复合体识别算法研究[D]. 代启国.哈尔滨工业大学2015
  • [9].蛋白质网络中复合物的挖掘与应用研究[D]. 任峻.中南大学2013

相关论文

  • [1].蛋白质相互作用网络的数值研究[D]. 谢江.上海大学2008
  • [2].复杂生物网络聚类分析方法[D]. 梅娟.江南大学2010
  • [3].基于蛋白网络聚类的基因功能研究[D]. 卢宏超.中国科学院研究生院(计算技术研究所)2006
  • [4].蛋白质结构及分子对接的理论研究[D]. 郑清川.吉林大学2006
  • [5].基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D]. 俞晓晶.中国科学院研究生院(上海生命科学研究院)2006
  • [6].基于结构生物信息学的蛋白质设计[D]. 蔡晓辉.中国科学院研究生院(上海生命科学研究院)2006
  • [7].生物大分子序列比对和蛋白质结构分类算法[D]. 李玉岗.中国科学院研究生院(计算技术研究所)2004
  • [8].蛋白质相互作用网络的比较生物学分析及其应用[D]. 梁治.中国科学技术大学2006
  • [9].蛋白质相互作用及其位点的预测方法研究[D]. 王兵.中国科学技术大学2006
  • [10].面向蛋白质结构预测的计算生物学技术研究[D]. 何洁月.东南大学2006

标签:;  ;  ;  ;  ;  

Structural Modeling and Characterization of Protein Interaction Network
下载Doc文档

猜你喜欢