张龙:基于深度学习的蛋白质相互作用预测研究论文

张龙:基于深度学习的蛋白质相互作用预测研究论文

本文主要研究内容

作者张龙(2019)在《基于深度学习的蛋白质相互作用预测研究》一文中研究指出:蛋白质是生命活动的物质基础,在细胞生命活动中扮演着十分重要的角色。绝大部分蛋白质通过与其他的蛋白质发生互作从而执行多样的生物学功能。蛋白质相互作用是蛋白质组学研究的热点和难点之一,正确地识别蛋白质相互作用不仅有助于更全面地理解活细胞的生物分子生理过程,而且对于新药物的研发和疾病机制的探索等方面都具有重要的意义。基于传统湿实验识别蛋白质相互作用的技术存在费时,覆盖度有限且价格昂贵的缺点。近年来,研究者已经研发了一些利用机器学习和蛋白质氨基酸序列识别蛋白质相互作用的方法。但是这些方法普遍存在以下不足:1)蛋白质氨基酸序列向量化编码方法无法充分提取互作特征;2)忽视多种氨基酸序列编码和分类器间的互补信息,即仅使用单个编码算法和单个分类器预测蛋白质互作;3)蛋白质非相互作用数据集缺失或包含有大量噪声。为此,本文开展了如下工作:(1)针对蛋白质序列特征编码算法不能充分刻画氨基酸序列的连续和不连续区域中残基间的互作的问题,本文提出了一种基于局部三联体特征编码算法(LCTD:Local Conjoint Triad Description)和深度神经网络的方法—DNN-LCTD。局部三联体特征编码算法(LCTD)集成了三联体特征编码算法(CT:Conjoint Triad Descriptor)和局部特征编码算法(LD:Local Descriptor)的优点,因此它能更好的描述氨基酸序列连续和不连续区域隐藏的互作信息。深度神经网络(DNNs)不仅可以从原始数据中自动学习稳定的特征,而且还能描述和刻画数据的层次表示。DNN-LCTD在酵母菌蛋白质相互作用数据集上取得了优越的性能且仅耗时718秒,其中准确率(accuracy)达到93.12%,精度(precision)达到93.75%,AUC(Area Under Curve)达到97.92%。这些实验结果显示,DNN-LCTD能够高效且准确地预测蛋白质相互作用,同时还进一步证明了LCTD编码算法的优越性。(2)针对现有蛋白质相互作用预测方法忽略了多种氨基酸序列编码和分类器间互补信息的问题,本文提出了一种基于集成深度学习和集成蛋白质序列编码算法的分类方法—EnsDNN。EnsDNN首先分别利用自协方差特征编码算法(AC:auto covariance descriptor),LD,多尺度连续不连续局部特征编码算法(MCD:Multi-scale Continuous and Discontinuous local descriptor)编码氨基酸序列间的互作模式。然后基于每个特征编码算法训练不同配置的DNNs。最后为了利用AC,LD,MCD编码算法和不同DNNs间的互补信息,EnsDNN利用一个集成预测器自动地为每个DNNs分类器分配权重,并进行蛋白质互作预测。在酵母菌蛋白质数据集上,EnsDNN取得了优越的性能,准确率(accuracy)达到95.29%,召回率(recall)达到95.12%,精度(precision)达到95.45%。(3)针对蛋白质非相互作用数据集缺失或包含有大量噪声的问题。本文提出两种生成高质量非相互作用数据集的方法—NIP-SS和NIP-RW。NIP-SS和NIP-RW分别基于序列相似度和图上的随机游走的方法选择蛋白质非相互作用对。NIP-SS首先计算互作数据集中各蛋白质间的序列相似度,然后选取前m个最不相似的蛋白质对作为非相互作用对,同时控制已选择非互作用对的蛋白质的度分布与正数据集中的蛋白质度分布相似。NIP-RW则在蛋白质相互作用网络上进行k步随机游走,最后从更新后的邻接矩阵中选择无连接的蛋白质对作为非相互作用的数据。考虑到效率问题,本文使用AC编码氨基酸序列且使用深度神经网络作为分类器模型。大量的实验结果表明相较于其他已经存在的蛋白质非相互作用数据集生成策略,NIP-SS和NIP-RW可以生成更高质量的非相互作用对。实验结果还表明基于NIP-SS和NIP-RW策略生成的非相互作用数据集的DNNs模型的预测性能将更加准确和健壮。

Abstract

dan bai zhi shi sheng ming huo dong de wu zhi ji chu ,zai xi bao sheng ming huo dong zhong ban yan zhao shi fen chong yao de jiao se 。jue da bu fen dan bai zhi tong guo yu ji ta de dan bai zhi fa sheng hu zuo cong er zhi hang duo yang de sheng wu xue gong neng 。dan bai zhi xiang hu zuo yong shi dan bai zhi zu xue yan jiu de re dian he nan dian zhi yi ,zheng que de shi bie dan bai zhi xiang hu zuo yong bu jin you zhu yu geng quan mian de li jie huo xi bao de sheng wu fen zi sheng li guo cheng ,er ju dui yu xin yao wu de yan fa he ji bing ji zhi de tan suo deng fang mian dou ju you chong yao de yi yi 。ji yu chuan tong shi shi yan shi bie dan bai zhi xiang hu zuo yong de ji shu cun zai fei shi ,fu gai du you xian ju jia ge ang gui de que dian 。jin nian lai ,yan jiu zhe yi jing yan fa le yi xie li yong ji qi xue xi he dan bai zhi an ji suan xu lie shi bie dan bai zhi xiang hu zuo yong de fang fa 。dan shi zhe xie fang fa pu bian cun zai yi xia bu zu :1)dan bai zhi an ji suan xu lie xiang liang hua bian ma fang fa mo fa chong fen di qu hu zuo te zheng ;2)hu shi duo chong an ji suan xu lie bian ma he fen lei qi jian de hu bu xin xi ,ji jin shi yong chan ge bian ma suan fa he chan ge fen lei qi yu ce dan bai zhi hu zuo ;3)dan bai zhi fei xiang hu zuo yong shu ju ji que shi huo bao han you da liang zao sheng 。wei ci ,ben wen kai zhan le ru xia gong zuo :(1)zhen dui dan bai zhi xu lie te zheng bian ma suan fa bu neng chong fen ke hua an ji suan xu lie de lian xu he bu lian xu ou yu zhong can ji jian de hu zuo de wen ti ,ben wen di chu le yi chong ji yu ju bu san lian ti te zheng bian ma suan fa (LCTD:Local Conjoint Triad Description)he shen du shen jing wang lao de fang fa —DNN-LCTD。ju bu san lian ti te zheng bian ma suan fa (LCTD)ji cheng le san lian ti te zheng bian ma suan fa (CT:Conjoint Triad Descriptor)he ju bu te zheng bian ma suan fa (LD:Local Descriptor)de you dian ,yin ci ta neng geng hao de miao shu an ji suan xu lie lian xu he bu lian xu ou yu yin cang de hu zuo xin xi 。shen du shen jing wang lao (DNNs)bu jin ke yi cong yuan shi shu ju zhong zi dong xue xi wen ding de te zheng ,er ju hai neng miao shu he ke hua shu ju de ceng ci biao shi 。DNN-LCTDzai jiao mu jun dan bai zhi xiang hu zuo yong shu ju ji shang qu de le you yue de xing neng ju jin hao shi 718miao ,ji zhong zhun que lv (accuracy)da dao 93.12%,jing du (precision)da dao 93.75%,AUC(Area Under Curve)da dao 97.92%。zhe xie shi yan jie guo xian shi ,DNN-LCTDneng gou gao xiao ju zhun que de yu ce dan bai zhi xiang hu zuo yong ,tong shi hai jin yi bu zheng ming le LCTDbian ma suan fa de you yue xing 。(2)zhen dui xian you dan bai zhi xiang hu zuo yong yu ce fang fa hu lve le duo chong an ji suan xu lie bian ma he fen lei qi jian hu bu xin xi de wen ti ,ben wen di chu le yi chong ji yu ji cheng shen du xue xi he ji cheng dan bai zhi xu lie bian ma suan fa de fen lei fang fa —EnsDNN。EnsDNNshou xian fen bie li yong zi xie fang cha te zheng bian ma suan fa (AC:auto covariance descriptor),LD,duo che du lian xu bu lian xu ju bu te zheng bian ma suan fa (MCD:Multi-scale Continuous and Discontinuous local descriptor)bian ma an ji suan xu lie jian de hu zuo mo shi 。ran hou ji yu mei ge te zheng bian ma suan fa xun lian bu tong pei zhi de DNNs。zui hou wei le li yong AC,LD,MCDbian ma suan fa he bu tong DNNsjian de hu bu xin xi ,EnsDNNli yong yi ge ji cheng yu ce qi zi dong de wei mei ge DNNsfen lei qi fen pei quan chong ,bing jin hang dan bai zhi hu zuo yu ce 。zai jiao mu jun dan bai zhi shu ju ji shang ,EnsDNNqu de le you yue de xing neng ,zhun que lv (accuracy)da dao 95.29%,shao hui lv (recall)da dao 95.12%,jing du (precision)da dao 95.45%。(3)zhen dui dan bai zhi fei xiang hu zuo yong shu ju ji que shi huo bao han you da liang zao sheng de wen ti 。ben wen di chu liang chong sheng cheng gao zhi liang fei xiang hu zuo yong shu ju ji de fang fa —NIP-SShe NIP-RW。NIP-SShe NIP-RWfen bie ji yu xu lie xiang shi du he tu shang de sui ji you zou de fang fa shua ze dan bai zhi fei xiang hu zuo yong dui 。NIP-SSshou xian ji suan hu zuo shu ju ji zhong ge dan bai zhi jian de xu lie xiang shi du ,ran hou shua qu qian mge zui bu xiang shi de dan bai zhi dui zuo wei fei xiang hu zuo yong dui ,tong shi kong zhi yi shua ze fei hu zuo yong dui de dan bai zhi de du fen bu yu zheng shu ju ji zhong de dan bai zhi du fen bu xiang shi 。NIP-RWze zai dan bai zhi xiang hu zuo yong wang lao shang jin hang kbu sui ji you zou ,zui hou cong geng xin hou de lin jie ju zhen zhong shua ze mo lian jie de dan bai zhi dui zuo wei fei xiang hu zuo yong de shu ju 。kao lv dao xiao lv wen ti ,ben wen shi yong ACbian ma an ji suan xu lie ju shi yong shen du shen jing wang lao zuo wei fen lei qi mo xing 。da liang de shi yan jie guo biao ming xiang jiao yu ji ta yi jing cun zai de dan bai zhi fei xiang hu zuo yong shu ju ji sheng cheng ce lve ,NIP-SShe NIP-RWke yi sheng cheng geng gao zhi liang de fei xiang hu zuo yong dui 。shi yan jie guo hai biao ming ji yu NIP-SShe NIP-RWce lve sheng cheng de fei xiang hu zuo yong shu ju ji de DNNsmo xing de yu ce xing neng jiang geng jia zhun que he jian zhuang 。

论文参考文献

  • [1].长链非编码RNA-蛋白质相互作用及疾病关联算法的研究[D]. 张慧.吉林大学2019
  • [2].基于集成学习模型下的蛋白质交互作用预测方法研究[D]. 徐昌.安徽师范大学2019
  • [3].基于机器学习的蛋白质相互作用预测研究[D]. 曾建沧.厦门大学2017
  • [4].基于支持向量机的蛋白质结构类预测及蛋白质相互作用网络拓扑结构分析[D]. 王晶.西安电子科技大学2018
  • [5].基于深度学习的蛋白质相互作用预测方法的研究[D]. 孙士伟.安徽大学2018
  • [6].基于集成神经网络的蛋白质相互作用研究[D]. 崔娟.济南大学2012
  • [7].集成神经网络在预测蛋白质相互作用位点中的应用[D]. 沈孝利.济南大学2011
  • [8].基于多模态特征融合的蛋白质相互作用预测[D]. 温玉婷.深圳大学2018
  • [9].基于序列分段近邻编码的蛋白质热点残基预测方法研究[D]. 沈彤.安徽大学2019
  • [10].蛋白质突变位点数据库的构建及位点预测研究[D]. 刘全亚.安徽大学2019
  • 读者推荐
  • [1].SNP选择的关键技术及精神分裂症诊断模型研究[D]. 陆信蓓.江苏大学2019
  • [2].基于深度学习网络的剪接位点及蛋白质相互作用预测方法研究[D]. 姚雨.安徽大学2019
  • [3].基于卷积神经网络的乳腺肿瘤良恶性分类方法研究[D]. 陈远琴.郑州大学2019
  • [4].基于深度学习的蛇类图像分类问题研究[D]. 付永钦.浙江大学2019
  • [5].基于支持向量机的蛋白质结构类预测及蛋白质相互作用网络拓扑结构分析[D]. 王晶.西安电子科技大学2018
  • [6].基于集成支持向量机与随机森林的蛋白交互预测研究[D]. 刘天宇.东北师范大学2019
  • [7].基于机器学习的染色体拷贝数变异致病性预测工具[D]. 陶亦然.华东师范大学2019
  • [8].基于特征选择的结直肠癌预测模型研究[D]. 赵丹丹.山东师范大学2019
  • [9].基于高通量测序数据的跨界sRNA数据分析方法研究[D]. 占萌苹.吉林大学2019
  • [10].基于多信息融合的蛋白质相互作用预测研究[D]. 吴雪.青岛科技大学2019
  • 论文详细介绍

    论文作者分别是来自西南大学的张龙,发表于刊物西南大学2019-09-24论文,是一篇关于蛋白质相互作用论文,深度学习论文,氨基酸序列论文,序列特征编码论文,非相互作用负数据集论文,西南大学2019-09-24论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自西南大学2019-09-24论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  ;  ;  

    张龙:基于深度学习的蛋白质相互作用预测研究论文
    下载Doc文档

    猜你喜欢