基于离散特征的蛋白质亚细胞定位预测方法研究

基于离散特征的蛋白质亚细胞定位预测方法研究

论文摘要

蛋白质亚细胞定位与蛋白质功能,结构及相互作用都密切相关,因此建立可靠的亚细胞定位预测模型对理解蛋白质机能,生命活动以及药物研发都具有重大的意义。以蛋白质字母序列为研究对象,基于数学方法和计算机技术的预测方法成为了研究重点。虽然目前已经提出了许多此类预测方法,但是仍存在两方面问题:一、预测方法的时间复杂度和空间复杂度仍然较高。二、不能有效解决数据量有限且数据分布极度不平衡的数据集的预测问题。针对这两个问题,本文提出了两个基于离散特征的新型预测模型,主要创新工作概括如下:首先本文提出了基于蛋白质序列图形表达HR-Curve的亚细胞定位预测模型。HR-Curve的构建基于氨基酸理化性质分类和双向量,HR-Curve具有高可视性,信息完备性,分类可视性以及多应用性等特点。同时根据HR-Curve的特点,本文提出了一种高效的基于欧式距离的相似度计算方法MAV,该方法很大程度上降低了时间复杂度和空间复杂度。最后将HR-Curve应用到亚细胞定位预测。实验证明HR-Curve在保持较高预测准确性的同时,明显有效地提高了预测效率。针对第二个问题,本文提出了基于SVM的亚细胞定位迁移预测模型。该模型基于改进的基于亲疏水性的氨基酸分类的特征提取方法和SVM的迁移学习思想。通过加入自适应检测条件,在保证预测准确率的同时,迁移学习的收敛速度得到了有效地提高。最后从两方面验证了该迁移预测模型的特点和优势:一方面通过设计对照实验,证明迁移预测模型对特殊数据集的适用性及高效性。另一方面通过与其他方法对比,进一步说明迁移预测模型的特点和前景。

论文目录

  • 摘要
  • Abstract
  • 插图索引
  • 附表索引
  • 第1章 绪论
  • 1.1 引言
  • 1.2 选题背景和意义
  • 1.3 研究现状
  • 1.3.1 蛋白质序列图形表达
  • 1.3.2 基于 SVM 的蛋白质亚细胞定位预测方法
  • 1.4 本文主要研究工作与结构
  • 第2章 蛋白质图形表达和 SVM 的相关知识与概念
  • 2.1 蛋白质基础知识
  • 2.1.1 蛋白质序列的组成
  • 2.1.2 亚细胞结构及其功能
  • 2.2 蛋白质序列的图形表达
  • 2.2.1 蛋白质序列特征提取及图形表达构建
  • 2.2.2 蛋白质图形表达的应用
  • 2.2.3 方法分析与评价
  • 2.3 基于 SVM 的分类预测方法
  • 2.3.1 支持向量机的分类原理
  • 2.3.2 特征向量的构建
  • 2.3.3 基于 SVM 的亚细胞定位预测方法与评价
  • 2.4 预测结果测试方法
  • 2.5 小结
  • 第3章 基于图形表达的蛋白亚细胞定位预测方法
  • 3.1 引言
  • 3.2 新图形表达的原理与方法
  • 3.2.1 特征提取与图形构建
  • 3.2.2 HR-Curve 相关性质与证明
  • 3.2.3 距离计算方法
  • 3.3 新图形表达 HR-Curve 的应用与分析
  • 3.3.1 蛋白质相似性分析与进化树构建
  • 3.3.2 蛋白质亚细胞定位预测
  • 3.4 小结
  • 第4章 基于 SVM 的蛋白质亚细胞定位迁移预测方法
  • 4.1 引言
  • 4.2 迁移预测原理与方法
  • 4.2.1 数据集选取及特征分析
  • 4.2.2 蛋白质序列的特征提取与特征向量构建
  • 4.2.3 迁移预测
  • 4.3 迁移预测实验分析与方法比较
  • 4.3.1 迁移预测模型的参数确定
  • 4.3.2 对照实验结果比较与分析
  • 4.3.3 与其它方法比较与分析
  • 4.4 小结
  • 结论
  • 参考文献
  • 致谢
  • 附录 A 攻读学位期间所发表的学术论文和参加的项目
  • 相关论文文献

    • [1].基于Convolutional-LSTM的蛋白质亚细胞定位研究[J]. 计算机科学与探索 2019(06)
    • [2].用离散增量结合支持向量机方法预测蛋白质亚细胞定位[J]. 生物信息学 2010(03)
    • [3].Akt亚型的亚细胞定位决定了其特异的生物学作用[J]. 生理科学进展 2010(03)
    • [4].蛋白质亚细胞定位预测研究综述[J]. 计算机应用研究 2014(02)
    • [5].词袋模型在蛋白质亚细胞定位预测中的应用[J]. 食品与生物技术学报 2017(03)
    • [6].基于氨基酸约化和统计特征的蛋白质亚细胞定位预测[J]. 生物信息学 2015(02)
    • [7].一种根癌农杆菌介导的GFP亚细胞定位方法的优化[J]. 基因组学与应用生物学 2014(01)
    • [8].丹参转录因子SmGRAS3的克隆、亚细胞定位和表达分析[J]. 中国中药杂志 2019(22)
    • [9].番木瓜eIF4E家族蛋白的亚细胞定位[J]. 热带生物学报 2017(04)
    • [10].家蚕蛋白亚细胞定位预测模型的构建及其初步应用[J]. 浙江理工大学学报 2015(03)
    • [11].小麦TaGAPDH5基因的亚细胞定位和表达分析[J]. 农业科学研究 2019(01)
    • [12].一种新的蛋白质亚细胞定位预测方法[J]. 计算机工程与应用 2012(06)
    • [13].运用小波分析对蛋白质进行亚细胞定位预测(英文)[J]. 宁夏大学学报(自然科学版) 2008(03)
    • [14].蛋白质亚细胞定位预测中的序列编码技术研究[J]. 计算机科学 2012(S3)
    • [15].梭梭HaNAC1基因的亚细胞定位、转录激活及表达分析[J]. 分子植物育种 2019(04)
    • [16].水稻OsLecRK基因的亚细胞定位分析[J]. 湖北农业科学 2018(17)
    • [17].人钙周期素结合蛋白基因亚细胞定位载体的构建和鉴定[J]. 广东医学 2011(22)
    • [18].鸡importin β1基因真核表达载体的构建及亚细胞定位[J]. 中国家禽 2018(04)
    • [19].猪PKM2基因的序列分析与组织表达及亚细胞定位[J]. 湖南农业大学学报(自然科学版) 2019(01)
    • [20].丙型肝炎病毒核心蛋白反式激活基因2表达产物的亚细胞定位[J]. 中华实验和临床感染病杂志(电子版) 2010(01)
    • [21].白魔芋热激转录因子AaHSFA2a和AaHSFA2c的分离、亚细胞定位及表达分析[J]. 分子植物育种 2018(24)
    • [22].羊口疮024基因的表达、多抗制备及亚细胞定位[J]. 中国微生态学杂志 2018(10)
    • [23].EHV-1皮层蛋白VP22生物信息学分析及亚细胞定位研究[J]. 黑龙江畜牧兽医 2018(21)
    • [24].基于集成分类器的凋谢蛋白亚细胞定位预测方法[J]. 计算机与应用化学 2010(05)
    • [25].拟南芥细胞分裂素受体AHK3亚细胞定位信号的研究[J]. 华南农业大学学报 2017(06)
    • [26].基于三层集成多标记学习的蛋白质多亚细胞定位预测[J]. 计算机应用 2016(08)
    • [27].PCA方法在蛋白质亚细胞定位中应用[J]. 大连理工大学学报 2012(03)
    • [28].水稻OsUF的基序分析及其亚细胞定位[J]. 农业生物技术学报 2019(02)
    • [29].水稻OsNHX5基因的亚细胞定位及表达分析[J]. 热带生物学报 2019(02)
    • [30].苹果MdAFS基因亚细胞定位表达载体的构建及分析[J]. 山东农业大学学报(自然科学版) 2017(04)

    标签:;  ;  ;  ;  ;  

    基于离散特征的蛋白质亚细胞定位预测方法研究
    下载Doc文档

    猜你喜欢