王剑:基于分组式的多分类器的蛋白质二级结构预测的算法研究论文

王剑:基于分组式的多分类器的蛋白质二级结构预测的算法研究论文

本文主要研究内容

作者王剑(2019)在《基于分组式的多分类器的蛋白质二级结构预测的算法研究》一文中研究指出:蛋白质二级结构预测是蛋白质结构预测和理解蛋白质结构和功能的重要课题,主要工作是依据蛋白质氨基酸序列的编码特征正确识别出对应的蛋白质二级结构标签。本文采用25PDB蛋白质序列数据集,采用PSSM编码﹑正交编码和滑动窗口方法将氨基酸处理成伪图像对蛋白质二级结构预测做了研究,在研究过程中选定了三种训练模型,分别是卷积神经网络﹑LSTM神经网络和随机森林。每个训练模型对应一个分组实验,在每个分组实验中对训练模型做了训练模型的优化设计:在基于卷积神经网络的分组实验中,设计了一个包含两个网络结构单元的一般卷积神经网络,每个网络单元包含主要的卷积层和下采样层,因为蛋白质氨基酸的伪图像对于卷积神经网络来说相对于真正的图像而言数据量较少,所以本文设计了一个可以增加输入冗余,解决一般卷积神经网络梯度偏离的残差卷积神经网络,实验证明这种卷积神经网络更加稳定,预测更准确。在基于LSTM神经网络的分组实验中,分别对伪图像在两个维度上切片生成序列数据对于一般的LSTM神经网络做了实验,因为直接切片会破坏蛋白质氨基酸序列的上下文特,所以本文采用滑动窗口操作在蛋白质序列维度生成了多个BP神经网络隐层,将这些BP神经网络隐层神经元的输出当作序列数据输入LSTM神经网络,实验证明添加BP神经网络隐层的LSTM神经网络能更好的提取蛋白质序列的上下文特征。在基于随机森林的分组实验中,本文将残差卷积神经网络在最后一个平均池化层提取的样本特征作为随机森林的输入,相当于为随机森林做了一个特征提取器,实验证明添加了特征提取器的随机森林预测结果会有很大提升。在分组实验结束之后,本文利用ensemble方法将实验中三种优化设计之后的模型进行了整合,将残差卷积神经网络﹑加入了BP神经网络隐层的LSTM神经网络和添加了特征提取器的随机森林模型在每个蛋白质二级标签上的输出概率相加,取最大概率对应的标签作为ensemble模型的输出,实验证明ensemble模型相对于三类成员模型的预测结果均有提高。

Abstract

dan bai zhi er ji jie gou yu ce shi dan bai zhi jie gou yu ce he li jie dan bai zhi jie gou he gong neng de chong yao ke ti ,zhu yao gong zuo shi yi ju dan bai zhi an ji suan xu lie de bian ma te zheng zheng que shi bie chu dui ying de dan bai zhi er ji jie gou biao qian 。ben wen cai yong 25PDBdan bai zhi xu lie shu ju ji ,cai yong PSSMbian ma ﹑zheng jiao bian ma he hua dong chuang kou fang fa jiang an ji suan chu li cheng wei tu xiang dui dan bai zhi er ji jie gou yu ce zuo le yan jiu ,zai yan jiu guo cheng zhong shua ding le san chong xun lian mo xing ,fen bie shi juan ji shen jing wang lao ﹑LSTMshen jing wang lao he sui ji sen lin 。mei ge xun lian mo xing dui ying yi ge fen zu shi yan ,zai mei ge fen zu shi yan zhong dui xun lian mo xing zuo le xun lian mo xing de you hua she ji :zai ji yu juan ji shen jing wang lao de fen zu shi yan zhong ,she ji le yi ge bao han liang ge wang lao jie gou chan yuan de yi ban juan ji shen jing wang lao ,mei ge wang lao chan yuan bao han zhu yao de juan ji ceng he xia cai yang ceng ,yin wei dan bai zhi an ji suan de wei tu xiang dui yu juan ji shen jing wang lao lai shui xiang dui yu zhen zheng de tu xiang er yan shu ju liang jiao shao ,suo yi ben wen she ji le yi ge ke yi zeng jia shu ru rong yu ,jie jue yi ban juan ji shen jing wang lao ti du pian li de can cha juan ji shen jing wang lao ,shi yan zheng ming zhe chong juan ji shen jing wang lao geng jia wen ding ,yu ce geng zhun que 。zai ji yu LSTMshen jing wang lao de fen zu shi yan zhong ,fen bie dui wei tu xiang zai liang ge wei du shang qie pian sheng cheng xu lie shu ju dui yu yi ban de LSTMshen jing wang lao zuo le shi yan ,yin wei zhi jie qie pian hui po huai dan bai zhi an ji suan xu lie de shang xia wen te ,suo yi ben wen cai yong hua dong chuang kou cao zuo zai dan bai zhi xu lie wei du sheng cheng le duo ge BPshen jing wang lao yin ceng ,jiang zhe xie BPshen jing wang lao yin ceng shen jing yuan de shu chu dang zuo xu lie shu ju shu ru LSTMshen jing wang lao ,shi yan zheng ming tian jia BPshen jing wang lao yin ceng de LSTMshen jing wang lao neng geng hao de di qu dan bai zhi xu lie de shang xia wen te zheng 。zai ji yu sui ji sen lin de fen zu shi yan zhong ,ben wen jiang can cha juan ji shen jing wang lao zai zui hou yi ge ping jun chi hua ceng di qu de yang ben te zheng zuo wei sui ji sen lin de shu ru ,xiang dang yu wei sui ji sen lin zuo le yi ge te zheng di qu qi ,shi yan zheng ming tian jia le te zheng di qu qi de sui ji sen lin yu ce jie guo hui you hen da di sheng 。zai fen zu shi yan jie shu zhi hou ,ben wen li yong ensemblefang fa jiang shi yan zhong san chong you hua she ji zhi hou de mo xing jin hang le zheng ge ,jiang can cha juan ji shen jing wang lao ﹑jia ru le BPshen jing wang lao yin ceng de LSTMshen jing wang lao he tian jia le te zheng di qu qi de sui ji sen lin mo xing zai mei ge dan bai zhi er ji biao qian shang de shu chu gai lv xiang jia ,qu zui da gai lv dui ying de biao qian zuo wei ensemblemo xing de shu chu ,shi yan zheng ming ensemblemo xing xiang dui yu san lei cheng yuan mo xing de yu ce jie guo jun you di gao 。

论文参考文献

  • [1].基于条件随机场与深度学习的蛋白质二级结构预测[D]. 王蕾蕾.齐鲁工业大学2019
  • [2].基于深度学习的蛋白质二级结构预测研究[D]. 赵志山.哈尔滨工业大学2018
  • [3].基于深度学习的蛋白质二级结构预测模型研究[D]. 常方雷.天津大学2018
  • [4].基于卷积神经网络的蛋白质二级结构预测[D]. 张帅燕.齐鲁工业大学2018
  • [5].基于对偶四元数特征融合的蛋白质二级结构检测方法[D]. 候飞翔.燕山大学2018
  • [6].利用序列信息预测蛋白质二级结构的深度学习模型研究[D]. 吴辉.天津大学2017
  • [7].基于平衡分类算法的蛋白质二级结构预测[D]. 李宁波.河南科技大学2017
  • [8].基于决策森林的蛋白质二级结构预测算法研究[D]. 李艳萍.河南大学2019
  • [9].蛋白质二级结构预测PSIPRED方法的改进及其应用[D]. 刘柏丽.湖南大学2014
  • [10].基于HMM的蛋白质二级结构预测分析[D]. 李维鹏.云南大学2017
  • 读者推荐
  • [1].基于决策森林的蛋白质二级结构预测算法研究[D]. 李艳萍.河南大学2019
  • [2].基于支持向量机的蛋白质结构类预测及蛋白质相互作用网络拓扑结构分析[D]. 王晶.西安电子科技大学2018
  • [3].基于条件随机场与深度学习的蛋白质二级结构预测[D]. 王蕾蕾.齐鲁工业大学2019
  • [4].基于深度学习的中文信息抽取研究[D]. 姜猛.贵州大学2019
  • [5].用于蛋白质二级结构设计的深度生成模型的研究与应用[D]. 常菁.北京交通大学2018
  • [6].基于卷积神经网络的蛋白质二级结构预测[D]. 张帅燕.齐鲁工业大学2018
  • [7].基于多分类器融合的蛋白质二级结构预测方法研究[D]. 杜月寒.齐鲁工业大学2018
  • [8].基于平衡分类算法的蛋白质二级结构预测[D]. 李宁波.河南科技大学2017
  • [9].基于神经网络的蛋白质二级结构预测算法研究[D]. 张蕾.河南大学2016
  • [10].生物序列比对算法研究[D]. 刘燕.第三军医大学2008
  • 论文详细介绍

    论文作者分别是来自齐鲁工业大学的王剑,发表于刊物齐鲁工业大学2019-08-27论文,是一篇关于蛋白质二级结构预测论文,卷积神经网络论文,随机森林论文,齐鲁工业大学2019-08-27论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自齐鲁工业大学2019-08-27论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  

    王剑:基于分组式的多分类器的蛋白质二级结构预测的算法研究论文
    下载Doc文档

    猜你喜欢