李文:基于k-mer相异度算法在系统进化关系中的应用论文

李文:基于k-mer相异度算法在系统进化关系中的应用论文

本文主要研究内容

作者李文(2019)在《基于k-mer相异度算法在系统进化关系中的应用》一文中研究指出:系统发育学是研究生物进化关系的一门学科,在系统发育学中,最常用于研究进化关系的方法就是系统进化树。基于多序列比对法的经典的系统进化树构建算法速度太慢,无法在大规模数据上进行运行,序列非比对法中基于k-mer的相异度算法构建系统进化树则不受这些限制影响,因而具有更广泛的应用前景。近些年来,基于k-mer的相异度算法被强调为基于系统发育推断中多重序列比对法的替代方法。基于k-mer的相异度算法属于序列非比对法中的一种,正处于快速发展的阶段,在不同的进化情景下使用基于k-mer的相异度算法系统地评估系统发育推理的准确性成为当前研究的一个热点和难点。本论文利用自己开发的软件包SeqDistK及一种比较经典的CAFE软件包实现了d2S等7种基于k-mer的相异度算法的距离矩阵,并在此基础上结合UPGMA构建系统进化树或进行聚类。基于一个已知进化关系的16S rRNA验证数据集(57条分子序列,称之为标准树),我们验证了基于k-mer的7种相异度算法构建系统进化树的准确度。与已知的真实进化关系相比较,我们发现基于k-mer的d2、d2S、d2star、Ma、Eu、Hao等多个相异度算法所得的系统进化树与标准树差异不大(Ch有一定的误差),特别是d2、d2star、d2S和Eu算法在k=5时有极其优异的性能,所得系统进化树与标准树相差无几。其中相异度算法d2S选取马尔可夫阶次为2时的算法可达到最高精准度(对称差仅有12)。本论文还利用软件包SeqDistK对63条16S rRNA序列所得的距离矩阵进行菌类聚类验证,发现所得聚类结果与生物分类学基本一致,其中d2S(k=5,M=2)的表现最为优秀,能准确的对样本序列聚类以及分类。另外我们发展的基于k-mer相异度算法的软件包SeqDistK无论是构建系统进化树还是菌类聚类具有运算速度快、精确度高的特点,适合于研究宏基因组大数据中的复杂系统发育关系的推理。使用基于k-mer相异度算法结合UPGMA研究基因组的复杂进化关系,这可能潜在地为系统进化提供新的见解,并改变我们传统的进行系统发育的研究方式,潜在地推进下一代系统发育学的发展。

Abstract

ji tong fa yo xue shi yan jiu sheng wu jin hua guan ji de yi men xue ke ,zai ji tong fa yo xue zhong ,zui chang yong yu yan jiu jin hua guan ji de fang fa jiu shi ji tong jin hua shu 。ji yu duo xu lie bi dui fa de jing dian de ji tong jin hua shu gou jian suan fa su du tai man ,mo fa zai da gui mo shu ju shang jin hang yun hang ,xu lie fei bi dui fa zhong ji yu k-merde xiang yi du suan fa gou jian ji tong jin hua shu ze bu shou zhe xie xian zhi ying xiang ,yin er ju you geng an fan de ying yong qian jing 。jin xie nian lai ,ji yu k-merde xiang yi du suan fa bei jiang diao wei ji yu ji tong fa yo tui duan zhong duo chong xu lie bi dui fa de ti dai fang fa 。ji yu k-merde xiang yi du suan fa shu yu xu lie fei bi dui fa zhong de yi chong ,zheng chu yu kuai su fa zhan de jie duan ,zai bu tong de jin hua qing jing xia shi yong ji yu k-merde xiang yi du suan fa ji tong de ping gu ji tong fa yo tui li de zhun que xing cheng wei dang qian yan jiu de yi ge re dian he nan dian 。ben lun wen li yong zi ji kai fa de ruan jian bao SeqDistKji yi chong bi jiao jing dian de CAFEruan jian bao shi xian le d2Sdeng 7chong ji yu k-merde xiang yi du suan fa de ju li ju zhen ,bing zai ci ji chu shang jie ge UPGMAgou jian ji tong jin hua shu huo jin hang ju lei 。ji yu yi ge yi zhi jin hua guan ji de 16S rRNAyan zheng shu ju ji (57tiao fen zi xu lie ,chen zhi wei biao zhun shu ),wo men yan zheng le ji yu k-merde 7chong xiang yi du suan fa gou jian ji tong jin hua shu de zhun que du 。yu yi zhi de zhen shi jin hua guan ji xiang bi jiao ,wo men fa xian ji yu k-merde d2、d2S、d2star、Ma、Eu、Haodeng duo ge xiang yi du suan fa suo de de ji tong jin hua shu yu biao zhun shu cha yi bu da (Chyou yi ding de wu cha ),te bie shi d2、d2star、d2She Eusuan fa zai k=5shi you ji ji you yi de xing neng ,suo de ji tong jin hua shu yu biao zhun shu xiang cha mo ji 。ji zhong xiang yi du suan fa d2Sshua qu ma er ke fu jie ci wei 2shi de suan fa ke da dao zui gao jing zhun du (dui chen cha jin you 12)。ben lun wen hai li yong ruan jian bao SeqDistKdui 63tiao 16S rRNAxu lie suo de de ju li ju zhen jin hang jun lei ju lei yan zheng ,fa xian suo de ju lei jie guo yu sheng wu fen lei xue ji ben yi zhi ,ji zhong d2S(k=5,M=2)de biao xian zui wei you xiu ,neng zhun que de dui yang ben xu lie ju lei yi ji fen lei 。ling wai wo men fa zhan de ji yu k-merxiang yi du suan fa de ruan jian bao SeqDistKmo lun shi gou jian ji tong jin hua shu hai shi jun lei ju lei ju you yun suan su du kuai 、jing que du gao de te dian ,kuo ge yu yan jiu hong ji yin zu da shu ju zhong de fu za ji tong fa yo guan ji de tui li 。shi yong ji yu k-merxiang yi du suan fa jie ge UPGMAyan jiu ji yin zu de fu za jin hua guan ji ,zhe ke neng qian zai de wei ji tong jin hua di gong xin de jian jie ,bing gai bian wo men chuan tong de jin hang ji tong fa yo de yan jiu fang shi ,qian zai de tui jin xia yi dai ji tong fa yo xue de fa zhan 。

论文参考文献

  • [1].基于免参数据挖掘的相异度度量研究[D]. 文娟娟.郑州大学2007
  • [2].基于K-匿名的隐私保护算法研究[D]. 董芳菲.西北师范大学2015
  • [3].一种基于小波变换的中文手写自动签名鉴定系统[D]. 李慧.山东大学2005
  • [4].基于序列模式的序列聚类挖掘算法研究[D]. 杨天霞.西北师范大学2010
  • 论文详细介绍

    论文作者分别是来自华南理工大学的李文,发表于刊物华南理工大学2019-10-23论文,是一篇关于相异度算法论文,系统进化树论文,聚类论文,华南理工大学2019-10-23论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自华南理工大学2019-10-23论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  

    李文:基于k-mer相异度算法在系统进化关系中的应用论文
    下载Doc文档

    猜你喜欢