基于机器学习的RNA干扰效率研究

基于机器学习的RNA干扰效率研究

论文摘要

自RNA干扰于1998年发现之后,RNA干扰已经成为了抑制基因表达的有效工具,已广泛应用在基因功能分析,疾病治疗、药物靶标发现以及抗肿瘤研究等方面。在RNA干扰的过程中,最重要的一步是设计高效的siRNA。虽然目前已经提出了一些预测方法,但存在着考虑因素单一、样本量小且大多是实验经验的定性总结等缺陷。因此,如何综合考虑各种因素从而设计高效的siRNA仍然是一项具有挑战性的工作。另外,针对目前mRNA二级结构是否与RNA干扰效率相关的矛盾结论,本文还对mRNA二级结构与RNA干扰效率的关系进行了研究。随着实验样本的增加,使得采用机器学习方法来研究RNA干扰效率成为了可能。为了构建分类器,我们首先利用siRecords数据库构建了分类器所需的训练集及测试集。对于每个样本,我们分别从siRNA序列碱基特征、siRNA序列片段特征、热力学特征及结构特征四个方面进行了特征提取。为了研究靶标mRNA二级结构与RNA干扰效率的关系,我们利用RNA二级结构谱概念,采用基于Na?ve Bayes方法的TClass分类程序构建了分类器。然后,在此基础上,综合考虑了各种特征,分别采用支持向量机方法和人工神经网络构建了分类器siRNAFilter-SVM和siRNAFilter-ANN,同时,为了提高分类器的性能,我们分别采用GA算法搜索了影响SVM分类器性能的两个重要参数C和γ以及采用bagging集成方法优化了人工神经网络的泛化能力。采用Na?ve Bayes方法构建的TClass分类器从RNA二级结构谱中筛选出了9个特征,通过这9个特征,分类精度达到了74.67%。通过对测试集分类的结果表明,采用支持向量机方法构建的分类器的敏感性和特异性分别为16.3%和92.1%。采用人工神经网络构建的分类器有着较好的性能,敏感性与特异性分别为20.5%和94.2%。只需mRNA与siRNA结合区域附近的9个序列片段自由能数值作为特征就能达到较高分类精度,这表明mRNA局部片段的二级结构自由能与RNA干扰效率之间是有关系的。另外,通过与最近公开发表的其它大学与研究机构的分类程序相比,采用人工神经网络构建的分类程序siRNAFilter-ANN在保持较高特异性的同时达到了较高的敏感性,适于用来设计siRNA序列。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题背景
  • 1.1.1 RNA 干扰的发现
  • 1.1.2 RNA 干扰的原理和特征
  • 1.1.3 RNA 干扰的作用
  • 1.1.4 RNA 干扰的价值
  • 1.2 研究内容及国内外研究现状
  • 1.2.1 RNA 干扰技术的关键环节
  • 1.2.2 国外研究现状
  • 1.2.3 国内研究现状
  • 1.3 论文的研究内容与创新点
  • 1.4 论文概述
  • 第二章 数据分析与特征提取
  • 2.1 数据来源
  • 2.1.1 RNA 干扰实验简介
  • 2.1.2 目前主要数据库
  • 2.1.3 数据库的选取
  • 2.2 数据分析
  • 2.3 特征分析与特征提取
  • 2.3.1 siRNA 序列碱基特征
  • 2.3.2 siRNA 序列片段特征
  • 2.3.3 热力学特征
  • 2.3.4 结构特征
  • 第三章 模型构建
  • 3.1 MRNA 二级结构自由能与RNA 干扰效率之间关系研究
  • 3.1.1 特征变量筛选
  • 3.1.2 稳定性分析
  • 3.1.3 筛选结果
  • 3.2 基于支持向量机方法的模型构建
  • 3.2.1 支持向量机方法
  • 3.2.2 遗传算法
  • 3.2.3 特征变量筛选
  • 3.2.4 基于遗传算法与SVM 的分类器构建
  • 3.3 基于人工神经网络方法的模型构建
  • 3.3.1 人工神经网络方法
  • 3.3.2 集成学习方法
  • 3.3.3 基于Bagging 方法的神经网络分类器构建
  • 第四章 结果与讨论
  • 4.1 分类效果及讨论
  • 4.2 特征选取的讨论
  • 4.3 模型构建的讨论
  • 4.3.1 采用GA 算法搜索SVM 参数
  • 4.3.2 采用集成提高分类器性能
  • 第五章 总结与展望
  • 5.1 全文总结
  • 5.2 后续工作
  • 致谢
  • 参考文献
  • 作者在学习期间取得的学术成果
  • 相关论文文献

    • [1].长链非编码RNA、焦亡和心肌缺血-再灌注损伤[J]. 生物化学与生物物理进展 2019(12)
    • [2].非小细胞肺癌的潜在生物标记物:长链非编码RNA[J]. 现代肿瘤医学 2020(01)
    • [3].非编码RNA在细胞自噬中的研究进展[J]. 中国生物工程杂志 2019(12)
    • [4].环状RNA影响肝疾病的发生发展[J]. 中国生物化学与分子生物学报 2019(12)
    • [5].环状RNA在肝细胞癌中的作用及机制[J]. 中国生物化学与分子生物学报 2019(12)
    • [6].环状RNA在胃癌中的研究进展[J]. 生物技术通讯 2019(06)
    • [7].西花蓟马不同RNA干扰技术比较研究[J]. 福建农业学报 2019(10)
    • [8].微小RNA在非酒精性脂肪肝病中调控作用的研究进展[J]. 重庆医科大学学报 2019(12)
    • [9].卵巢上皮性癌中RNA结合基序蛋白3及环氧化酶-2的表达与意义[J]. 医疗装备 2019(23)
    • [10].非编码RNA在周围神经损伤修复中的重要角色和作用[J]. 中国组织工程研究 2020(14)
    • [11].长链非编码RNA在鼻咽癌中的研究进展[J]. 中国医药 2020(01)
    • [12].微小循环RNA在鉴别前列腺增生和前列腺癌的有效性分析[J]. 临床泌尿外科杂志 2020(01)
    • [13].长链非编码RNA调控肝纤维化信号通路的研究进展[J]. 胃肠病学 2019(11)
    • [14].环状RNA在肺腺癌中的差异表达分析[J]. 东南大学学报(医学版) 2019(06)
    • [15].环状RNA调控结肠直肠癌的研究进展[J]. 外科理论与实践 2019(06)
    • [16].RNA干扰药物——下一代治疗药物?[J]. 科学通报 2020(07)
    • [17].环状RNA生物学功能及其在组织修复过程中的作用[J]. 中国组织工程研究 2020(17)
    • [18].Deep Learning Deciphers Protein–RNA Interaction[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [19].CIRCexplorer3:A CLEAR Pipeline for Direct Comparison of Circular and Linear RNA Expression[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [20].环状RNA在冠状动脉粥样硬化性心脏病中的研究进展[J]. 心血管病学进展 2019(09)
    • [21].心肌纤维化研究的新领域——长链非编码RNA[J]. 心血管病学进展 2019(09)
    • [22].长链非编码RNA及相关调控通路与急性心肌梗死的研究进展[J]. 心血管病学进展 2019(08)
    • [23].微小RNA在自身免疫性甲状腺疾病中的研究进展[J]. 江苏大学学报(医学版) 2020(01)
    • [24].结直肠癌相关长链非编码RNA调控信号通路研究进展[J]. 西部医学 2020(02)
    • [25].环状RNA与肝癌相互关系的研究进展[J]. 中国卫生检验杂志 2020(03)
    • [26].非编码RNA在葡萄膜炎发生发展过程中的调控作用研究进展[J]. 眼科新进展 2020(01)
    • [27].长链非编码RNA在心血管疾病中的研究进展[J]. 临床误诊误治 2020(02)
    • [28].长链非编码RNA影响糖尿病心肌病的研究[J]. 糖尿病新世界 2020(01)
    • [29].骨肉瘤中环状RNA的研究进展[J]. 临床与病理杂志 2020(02)
    • [30].长链非编码RNA作为肾细胞癌预后生物标志物的研究新进展[J]. 现代肿瘤医学 2020(05)

    标签:;  ;  ;  ;  

    基于机器学习的RNA干扰效率研究
    下载Doc文档

    猜你喜欢