从基因组序列预测CpG岛甲基化的倾向性

从基因组序列预测CpG岛甲基化的倾向性

论文摘要

表观遗传学(Epigenetics)是指研究在不改变DNA序列的情况下影响基因表达的遗传机制。DNA甲基化修饰是目前研究最为深入的一类表观遗传学信号,一般发生在双核苷酸CpG中。人类基因组中大约60%的基因启动子区域含有CpG岛,其甲基化状态直接关系到基因转录。例如在很多肿瘤细胞中,抑癌基因启动子区的CpG岛往往会发生异常的高甲基化,从而导致抑癌基因转录失活,无法行使其抑制癌症发生的功能。因此,确定CpG岛的甲基化状态有助于理解基因转录调控的机制,对于许多疾病的诊断和治疗意义重大。大规模实验检测CpG岛甲基化状态费时费力,代价高昂,而且已有的研究证实DNA序列中存在决定CpG岛甲基化状态的信号,因此通过计算预测CpG岛的甲基化状态是当前备受关注的一个课题。本文的主要工作就是基于人脑测得的DNA甲基化数据,挖掘DNA序列特征,用支持向量机(SVM)的方法实现了预测CpG岛甲基化的目标,得到了85%的预测正确率,同时还验证了所选的三类特征对于CpG岛甲基化的指导作用,它们分别是DNA序列组合、转录因子结合位点TFBS和短重复序列Alu。此外,我们还构建了一个在线预测CpG岛甲基化状态的工具MethCGI。通过和现有方法的比较,我们发现MethCGI有更好的预测性能。在后续工作中,我们进一步研究了那些不易甲基化的CpG岛之所以不被甲基化的保护机制。通过比较不易甲基化和容易甲基化的CpG岛内部及边界的序列片段,我们得到了一些特殊的序列模式,大多是一些含有锌指结构的DNA结合蛋白的特定结合位点,有部分在以往的实验中已被证实可以通过结合蛋白阻碍DNA甲基化的蔓延。最后,作为补充,我们还介绍了诸如核小体定位、组蛋白修饰以及基因印迹等其他表观遗传学信号的实验检测方法和计算研究现状。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 课题背景
  • 1.1.1 表观遗传学与DNA 甲基化
  • 1.1.2 CpG 岛
  • 1.1.3 课题意义
  • 1.2 研究现状
  • 1.3 本论文研究内容
  • 1.4 章节安排
  • 第2章 CPG 岛甲基化的预测
  • 2.1 DNA 甲基化的检测方法
  • 2.1.1 亚硫酸氢钠(sodium bisulfite)法
  • 2.1.2 甲基化敏感的限制性内切酶法
  • 2.1.3 基因表达阵列法
  • 2.2 实验数据集及训练样本的选取
  • 2.3 特征选择
  • 2.3.1 CpG 岛定义涉及的序列组成特征
  • 2.3.2 转录因子结合位点TFBS
  • 2.3.3 短重复序列Alu Y
  • 2.4 实验结果及讨论
  • 2.4.1 支持向量机(SVM)简介
  • 2.4.2 分类器的构建及性能
  • 2.4.3 在线预测工具MethCGI
  • 2.4.4 与其他DNA 甲基化预测工作的比较
  • 2.4.5 分类相关的转录因子结合位点(TFBS)
  • 2.4.6 MethCGI 在其他组织中的应用
  • 第3章 CPG 岛不被甲基化的保护机制探索
  • 3.1 研究现状
  • 3.2 计算研究探索CPG 岛不被甲基化的保护机制
  • 3.3 机制探讨及前景展望
  • 第4章 其他表观遗传学的研究现状
  • 4.1 核小体定位(NUCLEOSOME POSITIONING)
  • 4.1.1 核小体相位检测
  • 4.1.2 核小体定位的计算研究
  • 4.1.3 核小体定位计算研究小结
  • 4.2 组蛋白修饰(HISTONE MODIFICATION)
  • 4.2.1 组蛋白乙酰化(histone acetylation)
  • 4.2.2 组蛋白甲基化(histone methylation)
  • 4.2.3 组蛋白修饰的实验检测方法
  • 4.2.4 组蛋白修饰的计算研究
  • 4.3 基因印迹(IMPRINTING)
  • 4.3.1 基因印迹的实验检测
  • 4.3.2 计算方法预测基因印迹
  • 第5章 总结与展望
  • 参考文献
  • 致谢
  • 个人简历、在学期间发表的学术论文与研究成果
  • 相关论文文献

    标签:;  ;  

    从基因组序列预测CpG岛甲基化的倾向性
    下载Doc文档

    猜你喜欢