论文摘要
选择性剪接是真核生物在后转录过程中最为重要的调控机制之一。经过二十多年的研究,尽管生物学家们已经初步了解了选择性剪接的模式、过程以及某些调控因子的功能,但是还远没有掌握选择性剪接的真实调控机理。近年来,随着科学家们对某些疾病(尤其是癌症)研究的深入,选择性剪接作为导致疾病的重要来源之一越来越得到重视。目前,在高通量芯片技术和高通量测序技术的推动下,全基因组范围内研究选择性剪接的调控机制正在成为生物界最为前沿、最为热门的话题之一。然而,目前该领域的研究基本上还处于生物实验阶段,本文最大的创新之处在于受选择性剪接的分子生物学过程的启发,首次通过模型来对选择性剪接调控因子及其功能进行预测。本文首先对选择性剪接的分子生物学过程,最新的研究技术和调控因子预测方法进行了较为详细的综述。其次详细设计了基于外显子芯片数据的统计方法和数据处理流程,目标是找出具有统计意义的发生选择性剪接差异的外显子,这些外显子的表达量差异和周围区域的候选模体信息将作为下一步模型的输入。在上述分子生物机理研究和外显子芯片数据分析的基础上,建立了一种线性的选择性剪接模型,该模型将两种状态下选择性剪接的差异考虑为多个调控因子的综合作用,通过外显子包含贡献值来评价每个候选模体对剪接差异的贡献。在搜索调控因子结合模体的环节,如果通过递归最小二乘算法,计算时间无法接受,因此本文引入了蚁群算法,采用并行计算。这种智能的启发式搜索算法大大提高了搜索效率。此外,本文还分析了各种参数设置对模型搜索结果的影响。线性模型能快速有效地从大量的待选模体中提取出最为重要的调控因子,这对于从海量的生物数据中提取最为主要的信息来说,是很有意义的。为了进一步研究提取的调控因子的具体调控功能,基于线性模型预测的结果,本文设计了基于模糊理论和支持向量机的功能预报模型。该模型经样本训练,能从以下三个方面对选择性剪接调控因子的功能进行预测、分析与评价:(1)预测单个调控因子对剪接差异的调控功能;(2)评价某一调控因子的功能受其他调控因子的影响;(3)预测多个调控因子的综合调控功能。由于选择性剪接机制十分复杂,本文最后简要提出了下一步的研究方向,并讨论了进一步完善模型的思路和方法。
论文目录
摘要ABSTRACT第1章 绪论1.1 课题研究的背景、目的和意义1.1.1 选择性剪接调控机制的研究背景1.1.2 选择性剪接调控机制的研究意义1.2 选择性剪接调控机制的研究现状1.3 基于剪接差异的选择性剪接模型的框架流程图1.4 本文的主要工作1.5 本文的内容安排第2章 选择性剪接机制与研究技术2.1 mRNA前体选择性剪接综述2.1.1 基因表达与选择性剪接2.1.2 mRNA前体剪接的分子生物学机理2.1.3 选择性剪接的种类2.1.4 选择性剪接的调控机制2.1.5 选择性剪接调控因子2.2 全基因组范围内选择性剪接的研究方法和技术简介2.2.1 基于高通量基因芯片的全基因组选择性剪接研究技术2.2.2 基于高通量测序的全基因组选择性剪接研究技术2.3 本章小结第3章 外显子芯片数据统计分析与处理3.1 生物芯片技术简介3.1.1 基因芯片技术简介3.1.2 外显子芯片技术简介3.2 外显子芯片数据处理流程3.3 外显子芯片数据校正与标准化3.4 PSR和基因表达量估计3.4.1 PLIER算法3.4.2 基因表达量估计3.5 外显子芯片数据过滤3.6 外显子选择性剪接分析3.7 外显子芯片数据的处理结果3.8 本章小结第4章 线性选择性剪接模型与调控因子的预报4.1 选择性剪接机制的线性模型4.1.1 选择调控区域与搜索候选模体4.1.2 最小二乘法估计4.1.3 结合模体的选择4.2 基于蚁群算法的改进搜索算法4.2.1 蚁群算法4.2.2 基于蚁群算法的模体搜索方法4.2.3 算法的再现性和选择性评价4.3 实验结果分析4.3.1 基于递归最小二乘法的选择性剪接模型结果分析4.3.2 基于蚁群改进搜索算法的搜索结果分析4.4 本章小结第5章 基于模糊理论与支持向量机的调控因子功能预报模型5.1 模糊理论与支持向量机简介5.1.1 模糊理论简介5.1.2 支持向量机简介5.2 模型的整体设计与训练5.2.1 调控因子作用能力的评价5.2.2 支持向量机分类器的设计与训练5.3 基于模型的调控因子功能的预报5.3.1 单个调控因子在选择性剪接过程中的功能预报5.3.2 单个调控因子调控功能受其他调控因子的影响5.3.3 多个调控因子在选择性剪接过程中的综合调控功能预报5.4 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果致谢
相关论文文献
标签:选择性剪接论文; 调控因子论文; 高通量外显子芯片论文; 支持向量机论文;