本文主要研究内容
作者王可尧(2019)在《基于RNA-seq数据的可变剪接异构体功能预测方法研究》一文中研究指出:蛋白质是构成生命体内细胞和组织的重要成分,其通常由成熟mRNA(可变剪接异构体—isoform)经过翻译后产生。生命体内的绝大多数生命活动都需要蛋白质的参与,因此准确地预测蛋白质的功能能够帮助人类更好地了解生命活动的本质,探索疾病的机理和研究新药物。现有的蛋白质功能预测研究往往都是在基因层面展开的,即预测某个基因具有何种功能。然而单个基因在转录翻译的过程中受可变剪接的影响通常会产生多种不同的蛋白质变种,导致基因层面的功能标注并不能直接对应到每个蛋白质变种上。因此,isoform作为产生蛋白质变种的载体,如何预测isoform功能成为了蛋白质功能预测研究的新方向。然而,isoform层面的数据缺失和其自身真实功能标记的缺失限制了其功能预测研究。高通量转录组测序(RNA-Seq)技术的高速发展与广泛应用产生了大量转录组序列数据,为区分不同isoform提供了高分辨率的数据资源。基于RNA-seq数据的isoform功能预测算法近几年成为研究热点,此类算法都是在RNA-seq数据的基础上,结合已知的基因功能标记和基因-isoform关联关系完成功能预测任务。但是这些方法忽略了基因层面的有益数据,例如基因互相作用数据和基因本体结构数据。此外,现有的isoform功能预测方法还存在两方面的问题待解决:(i)均假设已知的基因功能标记是完整的,但已知的基因功能标记并不完整,存在缺失;(ii)仅将基因功能标记分配至其isoform上,并没有考虑功能标记从isoform到基因的反向聚合。本文针对当前isoform功能预测算法存在的不足,以有效结合基因互作数据和基因本体结构知识数据为抓手,以提升当前isoform功能预测准确率为目标,以多标记多示例学习框架为模型基础,对isoform功能预测问题展开研究,提出两个计算方法。本文的主要贡献包括:(1)针对现有方法仅将基因功能标记单向传递至其isoform和忽视了基因互作数据等问题,本文提出了一种基于异构网络的双随机游走isoform功能预测算法—IsoFun。IsoFun首先基于由多个RNA-seq数据集收集的isoform表达特征数据构建isoform功能关联网络,并将基因的所有功能标记分配给其isoform。然后,IsoFun构建由isoform,基因和GO术语组成的异构网络,以编码基因和isoform之间的从属关系,GO功能术语之间的层次关系和isoform之间的功能关联。这种异构网络可以协同利用基因水平的互作数据,已知的基因GO功能注释以及基因和isoform之间的关系,从而减少不完整单一数据的影响。在此基础上,IsoFun在构建的异构网络上引入了基于双随机游走的标签传播策略预测isoform功能。为了确保基因的已知功能标记被该基因的isoform继承,IsoFun在每次随机游走的迭代中将已知基因功能标记回溯到其最“负责”的isoform上。在人类RNA-seq数据集上的实验结果表明,IsoFun的性能相比现有的isoform功能预测算法的性能有明显提升,通过与自身变种算法的对比,进一步证实了功能标记信息的动态双向传播的优势,基因层面互作数据和基因本体结构数据在isoform功能预测中的辅助作用。此外,在两个isoform功能标记已知的基因ADAM15和BCL2L1的预测结果中,IsoFun能够有效地区分这些基因各自isoform的功能。(2)已知的基因功能标记是不完整的,随着时间的迁移,新的基因功能标记会被加入,但是现有的isoform功能预测算法假设已知的基因功能标记是完整的。针对此问题,本文提出了一种基于协同矩阵分解的isoform功能预测算法—DisoFun。DisoFun假设基因的功能标记是由关键isoform功能标记汇聚获取的。首先,DisoFun对isoform表达特征数据进行聚类分析得到k个关键isoform以及其它isoform与关键isoform的关联关系,再利用isoform与关键isoform的关联将关键isoform的功能标记扩展到全部isoform。其次利用基因与isoform的关联关系将所有isoform的功能标记分别聚合到对应的基因上。在此基础上,整合上述目标,并最大化聚合得到的功能标记与已知的基因功能标记的一致性,将基因功能标记反向推回到关键isoform上,以协调关键isoform的识别和功能预测。鉴于基因相互作用数据和基因本体结构数据在基因功能预测中的重要性,以及基因功能标记的不完整。DisoFun分别利用基因互相作用网络和基因本体层次结构数据构建两个流形正则项来指导基因功能标记的补充,基因-关键isoform关联关系的发现和关键isoform功能标记的预测。实验结果表明,DisoFun相比现有的isoform功能预测方法在预测精度上有着显著的提升,结合基因互相作用网络和基因本体层次性有效地补充了基因和关键isoform的功能标记,进一步提高了isoform功能预测精度。本文还进一步研究了isoform水平功能已知的几个基因(LMNA,BCL2L1和CFLAR),DisoFun能够准确地区分这些基因各自isoform的特有功能。
Abstract
dan bai zhi shi gou cheng sheng ming ti nei xi bao he zu zhi de chong yao cheng fen ,ji tong chang you cheng shou mRNA(ke bian jian jie yi gou ti —isoform)jing guo fan yi hou chan sheng 。sheng ming ti nei de jue da duo shu sheng ming huo dong dou xu yao dan bai zhi de can yu ,yin ci zhun que de yu ce dan bai zhi de gong neng neng gou bang zhu ren lei geng hao de le jie sheng ming huo dong de ben zhi ,tan suo ji bing de ji li he yan jiu xin yao wu 。xian you de dan bai zhi gong neng yu ce yan jiu wang wang dou shi zai ji yin ceng mian zhan kai de ,ji yu ce mou ge ji yin ju you he chong gong neng 。ran er chan ge ji yin zai zhuai lu fan yi de guo cheng zhong shou ke bian jian jie de ying xiang tong chang hui chan sheng duo chong bu tong de dan bai zhi bian chong ,dao zhi ji yin ceng mian de gong neng biao zhu bing bu neng zhi jie dui ying dao mei ge dan bai zhi bian chong shang 。yin ci ,isoformzuo wei chan sheng dan bai zhi bian chong de zai ti ,ru he yu ce isoformgong neng cheng wei le dan bai zhi gong neng yu ce yan jiu de xin fang xiang 。ran er ,isoformceng mian de shu ju que shi he ji zi shen zhen shi gong neng biao ji de que shi xian zhi le ji gong neng yu ce yan jiu 。gao tong liang zhuai lu zu ce xu (RNA-Seq)ji shu de gao su fa zhan yu an fan ying yong chan sheng le da liang zhuai lu zu xu lie shu ju ,wei ou fen bu tong isoformdi gong le gao fen bian lv de shu ju zi yuan 。ji yu RNA-seqshu ju de isoformgong neng yu ce suan fa jin ji nian cheng wei yan jiu re dian ,ci lei suan fa dou shi zai RNA-seqshu ju de ji chu shang ,jie ge yi zhi de ji yin gong neng biao ji he ji yin -isoformguan lian guan ji wan cheng gong neng yu ce ren wu 。dan shi zhe xie fang fa hu lve le ji yin ceng mian de you yi shu ju ,li ru ji yin hu xiang zuo yong shu ju he ji yin ben ti jie gou shu ju 。ci wai ,xian you de isoformgong neng yu ce fang fa hai cun zai liang fang mian de wen ti dai jie jue :(i)jun jia she yi zhi de ji yin gong neng biao ji shi wan zheng de ,dan yi zhi de ji yin gong neng biao ji bing bu wan zheng ,cun zai que shi ;(ii)jin jiang ji yin gong neng biao ji fen pei zhi ji isoformshang ,bing mei you kao lv gong neng biao ji cong isoformdao ji yin de fan xiang ju ge 。ben wen zhen dui dang qian isoformgong neng yu ce suan fa cun zai de bu zu ,yi you xiao jie ge ji yin hu zuo shu ju he ji yin ben ti jie gou zhi shi shu ju wei zhua shou ,yi di sheng dang qian isoformgong neng yu ce zhun que lv wei mu biao ,yi duo biao ji duo shi li xue xi kuang jia wei mo xing ji chu ,dui isoformgong neng yu ce wen ti zhan kai yan jiu ,di chu liang ge ji suan fang fa 。ben wen de zhu yao gong suo bao gua :(1)zhen dui xian you fang fa jin jiang ji yin gong neng biao ji chan xiang chuan di zhi ji isoformhe hu shi le ji yin hu zuo shu ju deng wen ti ,ben wen di chu le yi chong ji yu yi gou wang lao de shuang sui ji you zou isoformgong neng yu ce suan fa —IsoFun。IsoFunshou xian ji yu you duo ge RNA-seqshu ju ji shou ji de isoformbiao da te zheng shu ju gou jian isoformgong neng guan lian wang lao ,bing jiang ji yin de suo you gong neng biao ji fen pei gei ji isoform。ran hou ,IsoFungou jian you isoform,ji yin he GOshu yu zu cheng de yi gou wang lao ,yi bian ma ji yin he isoformzhi jian de cong shu guan ji ,GOgong neng shu yu zhi jian de ceng ci guan ji he isoformzhi jian de gong neng guan lian 。zhe chong yi gou wang lao ke yi xie tong li yong ji yin shui ping de hu zuo shu ju ,yi zhi de ji yin GOgong neng zhu shi yi ji ji yin he isoformzhi jian de guan ji ,cong er jian shao bu wan zheng chan yi shu ju de ying xiang 。zai ci ji chu shang ,IsoFunzai gou jian de yi gou wang lao shang yin ru le ji yu shuang sui ji you zou de biao qian chuan bo ce lve yu ce isoformgong neng 。wei le que bao ji yin de yi zhi gong neng biao ji bei gai ji yin de isoformji cheng ,IsoFunzai mei ci sui ji you zou de die dai zhong jiang yi zhi ji yin gong neng biao ji hui su dao ji zui “fu ze ”de isoformshang 。zai ren lei RNA-seqshu ju ji shang de shi yan jie guo biao ming ,IsoFunde xing neng xiang bi xian you de isoformgong neng yu ce suan fa de xing neng you ming xian di sheng ,tong guo yu zi shen bian chong suan fa de dui bi ,jin yi bu zheng shi le gong neng biao ji xin xi de dong tai shuang xiang chuan bo de you shi ,ji yin ceng mian hu zuo shu ju he ji yin ben ti jie gou shu ju zai isoformgong neng yu ce zhong de fu zhu zuo yong 。ci wai ,zai liang ge isoformgong neng biao ji yi zhi de ji yin ADAM15he BCL2L1de yu ce jie guo zhong ,IsoFunneng gou you xiao de ou fen zhe xie ji yin ge zi isoformde gong neng 。(2)yi zhi de ji yin gong neng biao ji shi bu wan zheng de ,sui zhao shi jian de qian yi ,xin de ji yin gong neng biao ji hui bei jia ru ,dan shi xian you de isoformgong neng yu ce suan fa jia she yi zhi de ji yin gong neng biao ji shi wan zheng de 。zhen dui ci wen ti ,ben wen di chu le yi chong ji yu xie tong ju zhen fen jie de isoformgong neng yu ce suan fa —DisoFun。DisoFunjia she ji yin de gong neng biao ji shi you guan jian isoformgong neng biao ji hui ju huo qu de 。shou xian ,DisoFundui isoformbiao da te zheng shu ju jin hang ju lei fen xi de dao kge guan jian isoformyi ji ji ta isoformyu guan jian isoformde guan lian guan ji ,zai li yong isoformyu guan jian isoformde guan lian jiang guan jian isoformde gong neng biao ji kuo zhan dao quan bu isoform。ji ci li yong ji yin yu isoformde guan lian guan ji jiang suo you isoformde gong neng biao ji fen bie ju ge dao dui ying de ji yin shang 。zai ci ji chu shang ,zheng ge shang shu mu biao ,bing zui da hua ju ge de dao de gong neng biao ji yu yi zhi de ji yin gong neng biao ji de yi zhi xing ,jiang ji yin gong neng biao ji fan xiang tui hui dao guan jian isoformshang ,yi xie diao guan jian isoformde shi bie he gong neng yu ce 。jian yu ji yin xiang hu zuo yong shu ju he ji yin ben ti jie gou shu ju zai ji yin gong neng yu ce zhong de chong yao xing ,yi ji ji yin gong neng biao ji de bu wan zheng 。DisoFunfen bie li yong ji yin hu xiang zuo yong wang lao he ji yin ben ti ceng ci jie gou shu ju gou jian liang ge liu xing zheng ze xiang lai zhi dao ji yin gong neng biao ji de bu chong ,ji yin -guan jian isoformguan lian guan ji de fa xian he guan jian isoformgong neng biao ji de yu ce 。shi yan jie guo biao ming ,DisoFunxiang bi xian you de isoformgong neng yu ce fang fa zai yu ce jing du shang you zhao xian zhe de di sheng ,jie ge ji yin hu xiang zuo yong wang lao he ji yin ben ti ceng ci xing you xiao de bu chong le ji yin he guan jian isoformde gong neng biao ji ,jin yi bu di gao le isoformgong neng yu ce jing du 。ben wen hai jin yi bu yan jiu le isoformshui ping gong neng yi zhi de ji ge ji yin (LMNA,BCL2L1he CFLAR),DisoFunneng gou zhun que de ou fen zhe xie ji yin ge zi isoformde te you gong neng 。
论文参考文献
论文详细介绍
论文作者分别是来自西南大学的王可尧,发表于刊物西南大学2019-09-24论文,是一篇关于可变剪接异构体论文,功能预测论文,基因本体论文,双随机游走论文,协同矩阵分解论文,西南大学2019-09-24论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自西南大学2019-09-24论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。
标签:可变剪接异构体论文; 功能预测论文; 基因本体论文; 双随机游走论文; 协同矩阵分解论文; 西南大学2019-09-24论文;