RNA-seq数据分析和minimal intron最优长度维持机制的研究

RNA-seq数据分析和minimal intron最优长度维持机制的研究

论文摘要

由于二代测序技术的发展,不但大大降低了测序成本,而且还极大地提高了测序的通量。现在我们能以低成本,高通量获取基因组数据。更重要的是,二代测序技术应用到转录组的分析,使我们能获得细胞的精确的转录表达谱,这是以前的方法所不能比拟的。通过测序的方法计算基因表达量,通常要依赖覆盖度,不同的模型假设会得到不同的表达量。因此对二代测序产生的测序片段(reads)在基因上的分布性质的研究对计算基因表达量有重要的意义。在论文中,我们对reads的碱基成分,错误率以及其随基因序列GC含量变化的分布性质进行了考察。通过我分析发现reads的错误率在尾端显著增大,而且reads在基因中的分布,有在高GC含量区域丰度较高,而低GC含量区域丰度较低的规律。人类基因组计划开展以来,越来越多物种的基因组被测序出来。通过对基因组上基因结构的分析,人们发现多细胞真核生物的内含子(intron)的数量随长度分布呈现峰的特性,有的有双峰,有的只有单峰,但是在长度50-150bp(basepair)之间普遍都存在峰。峰值对应的长度是这部分内含子的最优长度,我们把峰值附近这部分内含子称作小内含子(minimal intron).通过我们之前的研究,发现这些小内含子具有重要的生物学意义,它们在基因中的位置在物种间极其保守,而且大都位于看家基因中,另外它们还决定了可变剪接的方式。可见,这个峰的维持对真核生物具有极其重要的意义。但维持最优长度峰的机制是什么还不得而知。在之前我们尝试应用内含子中的插入删除(Indel)的性质对峰的存在进行解释,但是由于测序数据的缺乏,只是大致观察到小内含子在最优长度两边的插入删除偏好性显著不同,大于最优长度的小内含子中删除(deletion)占主导,相反则插入(insertion)占主导。现在随着“千人基因组计划”数据的公布,我们重新分析了重测序的179个人(非洲人,欧洲人和亚洲人)来更加深入的研究小内含子峰的维持机制。通过对不同人群的Indel分析,我们都发现所有内含子中的插入删除数量随长度的增加逐渐减少,而且在各长度上删除的数量始终大于插入的数量。通过分析插入删除周围10bp的A&T碱基成分,我们发现随插入删除长度的增加,A&T组分的波动不断增大,波动的范围也不断扩宽。通过对小内含子中插入删除的频率进行分析,发现插入删除随着频率的增大明显的表现出维持最优长度的性质。最后我们对含有小内含子的基因和所有的基因进行了功能的富集性分析,并比较不同功能的基因的平均插入删除频率。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 图表目录
  • 第一章 引言
  • 1.1 RNA-seq数据的研究现状
  • 1.1.1 二代测序技术
  • 1.1.2 RNA-seq技术
  • 1.1.3 RNA-seq技术的优点和缺点
  • 1.1.4 RNA-seq数据的处理
  • 1.2 minimal intron的研究现状
  • 1.2.1 intron及其生物学功能
  • 1.2.2 Indel的产生及其生物学功能
  • 1.2.3 千人基因组计划
  • 1.2.4 minimal intron的研究背景和现状
  • 1.3 本文的研究内容和组织结构
  • 第二章 RNA-seq中基因GC含量对基因表达量计算的影响
  • 2.1 RNA-seq reads数据错误率的位置分布
  • 2.2 基因GC含量对通过read计算基因表达量的影响
  • 第三章 人的基因组中minimal intron的研究
  • 3.1 minimal intron的长度分布特征
  • 3.2 minimal intron的GC含量的分布
  • 第四章 minimal intron最优长度维持机制的分析
  • 4.1 intron中Indel的分布特点
  • 4.2 minimal intron中Indel周围序列的组分
  • 4.3 minimal intron中Indel随频率的变化规律
  • 4.4 minimal intron中Indel频率和其所在基因的功能的关系
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].Multiple intron gain and loss events occurred during the evolution of Cenp-A gene[J]. Chinese Science Bulletin 2013(18)
    • [2].Systematic analysis of intron size and abundance parameters in diverse lineages[J]. Science China(Life Sciences) 2013(10)
    • [3].Single nucleotide polymorphisms in intron 1 and intron 2 of Larimichthys crocea growth hormone gene are correlated with growth traits[J]. Chinese Journal of Oceanology and Limnology 2012(02)
    • [4].Association of TSHR gene intron 1 and 4p14 single-nucleotide polymorphisms and gene-gene interactions with Graves' disease[J]. China Medical Abstracts(Internal Medicine) 2016(03)
    • [5].Increased complexity of gene structure and base composition in vertebrates[J]. 遗传学报 2011(07)
    • [6].虎MHC ClassⅠ基因的克隆及测序[J]. 野生动物 2010(03)
    • [7].Arginine kinase in Toxocara canis:Exon-intron organization,functional analysis of site-directed mutants and evaluation of putative enzyme inhibitors[J]. Asian Pacific Journal of Tropical Medicine 2016(10)
    • [8].Effects of splice sites on the intron retention in histamine H_3 receptors from rats and mice[J]. 遗传学报 2009(08)
    • [9].The structure and function of catalytic RNAs[J]. Science in China(Series C:Life Sciences) 2009(03)
    • [10].甘丙肽重构基因GAL(intronⅡ)的克隆及其过表达转基因载体的构建[J]. 中国比较医学杂志 2011(01)
    • [11].显性白毛调控基因(KIT)对羊驼毛色作用的影响[J]. 中国兽医学报 2008(09)
    • [12].利用groupⅡ intron构建产气荚膜梭菌突变体[J]. 军事医学 2012(04)
    • [13].细菌Ⅱ组内含子(GroupⅡ intron)的转移机制[J]. 微生物学报 2009(06)
    • [14].Identification, development, and application of cross-species intron-spanning markers in lentil(Lens culinaris Medik.)[J]. The Crop Journal 2018(03)
    • [15].Association of Polymorphisms of rs179247 and rs12101255 in Thyroid Stimulating Hormone Receptor Intron 1 with an Increased Risk of Graves' Disease:A Meta-analysis[J]. Journal of Huazhong University of Science and Technology(Medical Sciences) 2016(04)
    • [16].牦牛IGF2内含子的遗传多态性及其遗传效应分析[J]. 华北农学报 2009(02)
    • [17].One-step generation of zebrafish carrying a conditional knockoutknockin visible switch via CRISPR/Cas9-mediated intron targeting[J]. Science China(Life Sciences) 2020(01)
    • [18].Mutation analysis of DJ-1 in patients with early-onset Parkinson's disease and relationship between the g. 168_185del polymorphism and Parkinson's disease[J]. China Medical Abstracts(Internal Medicine) 2013(04)
    • [19].SLC22A3基因intron7对基因转录的负性调控作用研究[J]. 重庆医科大学学报 2014(05)
    • [20].Correlations between recombination rate and intron distributions along chromosomes of C.elegans[J]. Progress in Natural Science 2009(04)
    • [21].A nucleotide substitution at the 5′ splice site of intron 1 of rice HEADING DATE 1(HD1) gene homolog in foxtail millet, broadly found in landraces from Europe and Asia[J]. The Crop Journal 2015(06)
    • [22].Single Nucleotide Polymorphism of CYP3A4 Intron 2 and Its Influence on CYP3A4 mRNA Expression and Liver Enzymatic Activity in Human Liver[J]. Journal of Huazhong University of Science and Technology(medical Sciences) 2015(04)
    • [23].Modification of Cre Gene by PCR Method[J]. Journal of Northeast Agricultural University(English Edition) 2010(02)
    • [24].Association of Surfactant Protein B Gene Polymorphisms (C/A-18, C/T1580, Intron 4 and A/G9306) and Haplotypes with Bronchopulmonary Dysplasia in Chinese Han Population[J]. Journal of Huazhong University of Science and Technology(Medical Sciences) 2013(03)
    • [25].Analysis of the human Atox 1 homologue in Wilson patients[J]. World Journal of Gastroenterology 2008(15)
    • [26].Functional Characterization of the Promoter and Second Intron of CUM1 During Flower Development in Cucumber(Cucumis sativus L.)[J]. Horticultural Plant Journal 2018(03)
    • [27].Functional Analysis of the ZAG2 Promoter from Maize in Transgenic Tobaccos[J]. Journal of Integrative Agriculture 2012(08)
    • [28].Hoxc13 Expression Pattern in Cashmere Goat Skin During Hair Follicle Development[J]. Agricultural Sciences in China 2009(04)
    • [29].家兔UCP2基因多态性的筛选和生物信息学研究[J]. 基因组学与应用生物学 2015(04)
    • [30].A genome-wide association analysis implicates SOX6 as a candidate gene for wrist bone mass[J]. Science China(Life Sciences) 2010(09)

    标签:;  ;  ;  

    RNA-seq数据分析和minimal intron最优长度维持机制的研究
    下载Doc文档

    猜你喜欢