蛋白质相互作用数据管理与分析预测

蛋白质相互作用数据管理与分析预测

论文摘要

当前生命科学研究已经进入后基因组学时代,其主要研究对象为结构基因组学和蛋白质组学。细胞的功能必须通过蛋白质相互作用才能实现,因此,对蛋白质相互作用的研究显得尤为重要。随着高通量的生物实验技术发展和应用,产生了大量的蛋白质相互作用实验数据,但是此类方法所得到的数据假阳性和假阴性比率都比较高。因此,有效的计算方法被用来蛋白质相互作用预测的研究。本文旨在以机器学习及模式识别理论为基础,以蛋白质序列信息为前提预测蛋白质相互作用。本文的主要工作包括:蛋白质相互作用预测算法和蛋白质相互作用数据管理工具。本文主要内容以及创新之处包括以下两方面:1、本文蛋白质相互作用预测算法基于蛋白质序列信息。首先对样本数据进行预处理,预处理得到的数据格式为本文自定义的特殊批处理数据格式。然后,分别对蛋白质序列的氨基酸频率、位置、物化性质、生化相似性等特征分别进行特征提取。接着,采用支持向量机作为样本的分类器,因为支持向量机是基于结构风险最小化的统计学习理论,并且支持向量机支持小样本分类预测。对于每一个特征所得到的数据训练支持向量机预测模型,分别将其置于组分分类器中。本文的3个支持向量机预测模型作为组合分类器的子分类器,采用基于成员的组合分类器预测算法得到最终预测结果。本文对组合分类器算法进行了详细的研究和公式推导,并且计算得出基于成员数目的组合分类器理论约束条件。在3类数据集合上:人、酵母、果蝇验证本文算法,组合分类器预测准确率优于单个分类器预测准确率,并且部分数据集预测结果高于相关文献的结果。2、本文的另外一部分工作是蛋白质相互作用数据管理工具的设计。因为本课题数据部分比较特殊:来源广泛、数据格式多样。因此会造成数据查询、插入和管理的困难。现有大部分网络数据库管理系统或提供蛋白质序列信息或提供相互作用信息,没有同时提供序列信息和相互作用信息。本课题设计的数据管理工具可以同时显示序列信息和相互作用信息,用户无需跨数据库平台就可以得到蛋白质相互作用研究所需的序列和相互作用信息。本工具为B/S结构,前台是基于ASP.NET网页开发平台和HTML脚本的WEB界面,后台采用C#.NET编写消息处理函数,前后台通信采用API函数。本工具的后台数据库采用SQL server。本工具是对蛋白质相互作用数据管理工具开发的一次有效尝试,其基本功能贴近课题实际。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 论文的研究背景
  • 1.2 论文主要内容
  • 1.3 论文的主要创新点
  • 1.4 论文的章节安排
  • 1.5 本章小结
  • 第二章 背景知识
  • 2.1 生物信息学简介
  • 2.2 信息科学时代的生物信息学
  • 2.3 机器学习技术及其在生物信息学中的应用
  • 2.3.1 机器学习技术
  • 2.3.2 机器学习技术在生物信息学中的应用
  • 2.4 本章小结
  • 第三章 系统框架性设计与数据预处理
  • 3.1 系统框架性设计
  • 3.2 实验数据来源和实验数据预处理
  • 3.3 本章小结
  • 第四章 蛋白质数据库及蛋白质相互作用数据管理工具设计
  • 4.1 常用的蛋白质序列及蛋白质相互作用数据库
  • 4.1.1 DIP 数据库
  • 4.1.2 INTACT 数据库
  • 4.1.3 SWISS-PROT 数据库
  • 4.1.4 PIR 数据库
  • 4.2 蛋白质相互作用数据管理平台设计
  • 4.3 本章小结
  • 第五章 蛋白质序列特征向量
  • 5.1 特征向量
  • 5.1.1 K-Length Count (KLC)
  • 5.1.2 K-Nearest-Neighbor(KNN)
  • 5.1.3 Bio-similarity(BIO)
  • 5.2 本章小结
  • 第六章 支持向量机(SVM)与组合分类器结构
  • 6.1 支持向量机
  • 6.1.1 支持向量机的背景理论基础
  • 6.1.2 线性判别函数和分类面
  • 6.1.3 支持向量机
  • 6.1.4 Libsvm
  • 6.2 组合分类器结构
  • 6.2.1 组合分类器的基本结构
  • 6.2.2 组合分类器决策
  • 6.3 本章小结
  • 第七章 算法结论和分析
  • 7.1 课题数据选择
  • 7.2 算法评价标准
  • 7.3 数据结论
  • 7.4 本章小结
  • 第八章 总结与展望
  • 8.1 总结
  • 8.2 展望
  • 部分课题算法实现程序
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 相关论文文献

    • [1].国外主要科学数据管理成本模型调研与分析[J]. 图书馆学研究 2019(22)
    • [2].三大关键要素,实现高效多云数据管理[J]. 软件和集成电路 2019(12)
    • [3].我国科学数据管理相关政策解读与人口健康科学数据管理的启示[J]. 医学信息学杂志 2019(12)
    • [4].科学数据管理体系的二维视角——《科学数据管理办法》解读[J]. 图书情报工作 2019(23)
    • [5].基于科学数据管理流程的科研机构职责分析[J]. 数字图书馆论坛 2020(01)
    • [6].“科学数据管理”专刊介绍[J]. 农业大数据学报 2019(04)
    • [7].国家大数据战略下教育大数据管理研究[J]. 管理观察 2020(04)
    • [8].数据管理计划在图书馆科学数据管理服务研究[J]. 中外企业家 2020(09)
    • [9].探索大数据管理的新模式[J]. 中国新通信 2020(04)
    • [10].建筑装饰设计的大数据管理及应用[J]. 现代物业(中旬刊) 2019(11)
    • [11].中医药临床研究电子数据管理特点及标准操作规程的制定[J]. 中国临床药理学与治疗学 2020(05)
    • [12].我国人文社会科学数据管理的主要问题与对策研究[J]. 图书情报工作 2020(06)
    • [13].山东省科学数据管理的问卷调查分析[J]. 中国科技资源导刊 2020(02)
    • [14].中外数据馆员培训实践调研与比较研究[J]. 新世纪图书馆 2020(02)
    • [15].国外高校图书馆科学数据管理政策研究——以英国剑桥大学图书馆为例[J]. 山东图书馆学刊 2020(02)
    • [16].国际公共资助的数字人文项目数据管理计划研究[J]. 内蒙古科技与经济 2020(11)
    • [17].加拿大科学数据管理及启示[J]. 图书馆杂志 2020(06)
    • [18].面向研究数据管理的高校图书馆学科服务模式探析[J]. 图书馆工作与研究 2020(06)
    • [19].大数据管理与应用新专业建设探索与实践——以北京信息科技大学为例[J]. 教育教学论坛 2020(31)
    • [20].新西兰高校科研数据管理服务调查研究[J]. 数字图书馆论坛 2020(06)
    • [21].大数据管理分析中的分类法[J]. 电子技术与软件工程 2020(10)
    • [22].智慧图书馆为教学科研提供数据管理服务的意义[J]. 科技经济导刊 2020(22)
    • [23].英国科学数据管理政策研究[J]. 医学信息学杂志 2020(07)
    • [24].人文社会科学数据管理的现实困境与对策分析[J]. 情报科学 2020(09)
    • [25].基于利益相关者的高校图书馆科学数据管理策略分析[J]. 图书馆工作与研究 2020(09)
    • [26].图书馆数据管理服务设计——基于中国科学院大学研究生的调查[J]. 图书馆学研究 2020(18)
    • [27].大数据背景下的电网企业数据管理[J]. 大众用电 2020(10)
    • [28].猪场数据管理的问题及展望[J]. 今日养猪业 2019(01)
    • [29].谈大数据管理的概念和挑战[J]. 才智 2019(06)
    • [30].利益相关者视角下档案部门参与科学数据管理的分析[J]. 档案天地 2019(03)

    标签:;  ;  ;  ;  ;  

    蛋白质相互作用数据管理与分析预测
    下载Doc文档

    猜你喜欢