基于转录组测序数据计算识别RNA编辑位点和可变剪接事件

基于转录组测序数据计算识别RNA编辑位点和可变剪接事件

论文摘要

RNA编辑和可变剪接是两种重要的转录后调控事件,有关RNA编辑和可变剪接的研究是功能基因组时代的重要前沿问题之一。本文主要围绕RNA编辑位点和可变剪接事件的识别这一问题开展研究,主要包括下面两部分内容:首先,使用黑猩猩转录组测序(RNA-Seq)数据识别RNA编辑位点。通过RNA-Seq序列与基因组序列的比对信息发现RNA-DNA错配位点,并构建编辑位点候选集。从中滤除基因组测序质量低的位点、单核苷酸多态性位点、随机测序错误等干扰,得到8334个RNA编辑位点。选取落在已知基因上的编辑位点进行生物学功能分析,并分析编辑位点上下游序列的特征。其次,本文使用果蝇RNA-Seq数据识别剪接位点和可变剪接事件。使用TopHat软件成功识别出39718个果蝇剪接位点,其中10584个新剪接位点。基于剪接位点的不同组合,针对各类型可变剪接特征开发出计算识别算法,成功应用于可变供体位点、可变受体位点、内含子保留和外显子缺失四种可变剪接类型。最终识别出8477个可变剪接事件,其中新可变剪接事件3922个。RT-PCR(Reverse transcription polymerasechain reaction)实验验证了2个果蝇基因上新识别的可变剪接事件,发现了全新的剪接异构体。本文基于RNA-Seq数据识别到大量的RNA编辑位点和新的可变剪接事件,为进一步了解RNA编辑和可变剪接的机制提供数据支持。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 前言
  • 1.1 RNA 的转录后加工
  • 1.1.1 RNA 编辑
  • 1.1.2 可变剪接
  • 1.1.3 RNA 编辑与可变剪接的相互作用
  • 1.2 测序技术研究进展概述
  • 1.2.1 Sanger 测序技术
  • 1.2.2 第二代测序技术
  • 1.2.3 第三代测序技术
  • 1.3 研究背景与意义
  • 1.3.1 研究背景
  • 1.3.2 研究意义
  • 1.4 RNA 编辑位点识别的研究进展
  • 1.5 可变剪接事件识别的研究进展
  • 1.6 本文主要工作
  • 1.7 论文结构安排
  • 第二章 计算识别黑猩猩 RNA 编辑位点
  • 2.1 底层数据处理
  • 2.1.1 数据来源
  • 2.1.2 序列比对及软件参数设置
  • 2.1.3 RNA-Seq 序列比对结果
  • 2.2 RNA 编辑位点候选集的构建
  • 2.3 RNA 编辑位点的筛选策略
  • 2.3.1 滤除基因组测序错误
  • 2.3.2 滤除已知 SNP 位点
  • 2.3.3 滤除落在 RNA-Seq 序列 3’末端位点
  • 2.3.4 滤除比对到内含子区域的 RNA-Seq 序列
  • 2.3.5 滤除 RNA-Seq 测序错误位点
  • 2.3.6 滤除可信度不高的位点
  • 2.3.7 滤除替换类型不定的编辑位点
  • 2.4 RNA 编辑位点的潜在功能分析
  • 2.4.1 RNA 编辑位点的编辑类型及分布情况
  • 2.4.2 RNA 编辑位点在 RefSeq 基因中的分布情况
  • 2.4.3 RNA 编辑位点对氨基酸的潜在影响
  • 2.4.4 RNA 编辑位点对 miRNA 的潜在影响
  • 2.4.5 RNA 编辑位点的组织差异性和性别差异性分析
  • 2.4.6 RNA 编辑位点的序列特征分析
  • 2.5 结果讨论
  • 2.6 小结
  • 第三章 计算识别果蝇剪接位点和可变剪接事件
  • 3.1 底层数据处理
  • 3.1.1 数据来源
  • 3.1.2 序列比对及软件参数设置
  • 3.1.3 RNA-Seq 序列比对结果
  • 3.2 果蝇剪接位点的识别
  • 3.2.1 重标注已知剪接位点
  • 3.2.2 识别新的剪接位点
  • 3.3 果蝇可变剪接事件的识别
  • 3.3.1 识别可变供体位点
  • 3.3.2 识别可变受体位点
  • 3.3.3 识别内含子保留
  • 3.3.4 识别外显子丢失
  • 3.3.5 识别结果
  • 3.4 新剪接位点和可变剪接事件的实验验证
  • 3.4.1 实验方法和步骤
  • 3.4.2 实验结果分析
  • 3.5 结果讨论
  • 3.6 小结
  • 第四章 总结与展望
  • 4.1 总结
  • 4.2 展望
  • 参考文献
  • 攻读硕士学位期间发表的文章
  • 致谢
  • 相关论文文献

    • [1].长链非编码RNA、焦亡和心肌缺血-再灌注损伤[J]. 生物化学与生物物理进展 2019(12)
    • [2].非小细胞肺癌的潜在生物标记物:长链非编码RNA[J]. 现代肿瘤医学 2020(01)
    • [3].非编码RNA在细胞自噬中的研究进展[J]. 中国生物工程杂志 2019(12)
    • [4].环状RNA影响肝疾病的发生发展[J]. 中国生物化学与分子生物学报 2019(12)
    • [5].环状RNA在肝细胞癌中的作用及机制[J]. 中国生物化学与分子生物学报 2019(12)
    • [6].环状RNA在胃癌中的研究进展[J]. 生物技术通讯 2019(06)
    • [7].西花蓟马不同RNA干扰技术比较研究[J]. 福建农业学报 2019(10)
    • [8].微小RNA在非酒精性脂肪肝病中调控作用的研究进展[J]. 重庆医科大学学报 2019(12)
    • [9].卵巢上皮性癌中RNA结合基序蛋白3及环氧化酶-2的表达与意义[J]. 医疗装备 2019(23)
    • [10].非编码RNA在周围神经损伤修复中的重要角色和作用[J]. 中国组织工程研究 2020(14)
    • [11].长链非编码RNA在鼻咽癌中的研究进展[J]. 中国医药 2020(01)
    • [12].微小循环RNA在鉴别前列腺增生和前列腺癌的有效性分析[J]. 临床泌尿外科杂志 2020(01)
    • [13].长链非编码RNA调控肝纤维化信号通路的研究进展[J]. 胃肠病学 2019(11)
    • [14].环状RNA在肺腺癌中的差异表达分析[J]. 东南大学学报(医学版) 2019(06)
    • [15].环状RNA调控结肠直肠癌的研究进展[J]. 外科理论与实践 2019(06)
    • [16].RNA干扰药物——下一代治疗药物?[J]. 科学通报 2020(07)
    • [17].环状RNA生物学功能及其在组织修复过程中的作用[J]. 中国组织工程研究 2020(17)
    • [18].Deep Learning Deciphers Protein–RNA Interaction[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [19].CIRCexplorer3:A CLEAR Pipeline for Direct Comparison of Circular and Linear RNA Expression[J]. Genomics,Proteomics & Bioinformatics 2019(05)
    • [20].环状RNA在冠状动脉粥样硬化性心脏病中的研究进展[J]. 心血管病学进展 2019(09)
    • [21].心肌纤维化研究的新领域——长链非编码RNA[J]. 心血管病学进展 2019(09)
    • [22].长链非编码RNA及相关调控通路与急性心肌梗死的研究进展[J]. 心血管病学进展 2019(08)
    • [23].微小RNA在自身免疫性甲状腺疾病中的研究进展[J]. 江苏大学学报(医学版) 2020(01)
    • [24].结直肠癌相关长链非编码RNA调控信号通路研究进展[J]. 西部医学 2020(02)
    • [25].环状RNA与肝癌相互关系的研究进展[J]. 中国卫生检验杂志 2020(03)
    • [26].非编码RNA在葡萄膜炎发生发展过程中的调控作用研究进展[J]. 眼科新进展 2020(01)
    • [27].长链非编码RNA在心血管疾病中的研究进展[J]. 临床误诊误治 2020(02)
    • [28].长链非编码RNA影响糖尿病心肌病的研究[J]. 糖尿病新世界 2020(01)
    • [29].骨肉瘤中环状RNA的研究进展[J]. 临床与病理杂志 2020(02)
    • [30].长链非编码RNA作为肾细胞癌预后生物标志物的研究新进展[J]. 现代肿瘤医学 2020(05)

    标签:;  ;  ;  ;  

    基于转录组测序数据计算识别RNA编辑位点和可变剪接事件
    下载Doc文档

    猜你喜欢