肿瘤患者等位基因缺失长度分布及无信息位点状态预测的研究

肿瘤患者等位基因缺失长度分布及无信息位点状态预测的研究

论文摘要

恶性肿瘤正在成为全世界范围内导致人类死亡的最重要原因之一,患者的数量也呈逐年递增之势,根据前人的研究判断很可能是由于染色体的不稳定性引起的。而更深入的研究表明包括等位基因缺失和突变在内的染色体的畸变引起了肿瘤抑制基因的失活,整条染色体、染色体臂、小的染色体片段都可能发生丢失。染色体畸变可以通过自发或者诱发产生,其产生原因和机理比较复杂,关于染色体结构畸变的机理主要有两种假说:一是断裂-重接假说,另一种是互换假说。所以,等位基因缺失分析已经成为一种发现信息位点和候选肿瘤抑制基因的有效方法。在等位基因缺失实验中,同一个个体的正常组织细胞和癌细胞在有信息的分子标记位点(单核苷酸多态、短串联重复、限制性片段长度多态等)上能够初步确定缺失染色体的区段。但是,由于癌症分子研究中有效数据的缺乏和测量的错误导致了癌症治疗和预防的困难;同时,产生于等位基因缺失实验中的大量的数据却没有得到充分地处理,这是因为存在大量的被当做无信息位点的纯合性标记位点的数据几乎都没有得到利用,这篇论文就是有关于通过计算机模拟的方法根据已知信息位点的缺失信息对癌细胞染色体上等位基因缺失状态特别是对纯合性标记位点的缺失状态进行统计学推断。近年来的研究表明肝癌患者中17号染色体短臂发生杂合性缺失的频率较高,因此对人类17p杂合性缺失的研究成为探讨癌症发生机制和寻找抑癌基因的一条途径。本文首先对上海肿瘤所提供的17号染色体短臂的SNP原始数据进行处理,利用各个发生缺失的位点与邻近位点的遗传图距可以得到各个位点发生缺失的长度(cM,centimorgan)。分析这些缺失长度和染色体缺失个数的分布情况,用适当的模型去描述这种分布,初步探讨了缺失长度的分布函数及缺失个数的分布函数与肿瘤发生的关系。其次,我们使用真实数据所得到的缺失长度分布和个数的分布去模拟100条发生缺失的癌症患者染色体,运用马尔科夫预测法的转移概率矩阵去预测无信息位点的状态,显示出了一定的效果。见附录1。为了验证马尔科夫预测方法对等位基因缺失状态尤其是对纯合性标记位点的状态的估计效果,我们模拟了同样的100条癌细胞染色体,每一条染色体上均匀的分布着60个SNP标记位点,也就是总共6000个位点。当然,在等位基因缺失实验中会产生大量的无信息位点,我们利用目前已有的方法暂时还不能判断出这些位点的状态(缺失或保留)。模拟的过程中,在这些染色体上人为的选择了一些片段作为等位基因缺失区域,这些片段的长度是遵从伽玛分布(参数参照于实际数据拟合的结果),而染色体上等位基因缺失的个数则是遵从泊松分布(参数参照于实际数据拟合的结果)的。这个分布会随机的给出一个数字作为一个特定染色体发生缺失的个数,那么每个缺失的位置和长度就被固定了下来。到此为止,每条染色体的每个标记位点都有了一个状态,不是缺失就是保留。而为了达到验证方法效果的目的,我们按比例人为地删去了一些位点的状态作为无信息位点。马尔科夫预测方法被利用来根据已知信息位点的状态数据估计无信息位点的状态。首先,我们依据那些已知位点的状态统计出了一步转移概率,每一个位点的状态数据被我们编写的程序自动的依次写入了EXCEL表格;第二,计算机程序开始逐一地扫描每个位点的状态,当扫描到无信息位点时,计算机程序根据该位点的上一个位点的状态(缺失或保留)自动地产生一个小数,也就是根据转移概率矩阵。同时,程序随机地产生另外一个小数,我们比较这两个数字的大小然后给出这个无信息位点的状态(缺失或保留)。第三,每一个标记位点都有了一个状态值,一步转移概率被重新计算当它原有的值被用过了一次之后;这个被称作是迭代的过程需要重复1000次或者更多次直到无信息位点的状态达到稳定态。这种相对的稳定是一种平均概念上的固定,即我们取迭代的最后200次或者是更多次的状态的次数是否包含80%的缺失次数或是保留次数来决定该位点的稳定态。转移概率矩阵被用来估计无信息位点的状态并表现出一定的效果,见附录2所示。我们可以从3282个模拟的无信息位点中推测出1563个位点的状态,这其中有1314个位点的状态推测正确,249个位点的状态推测错误,正确率是84%。在一定的程度上,每一个位点的缺失频率得到了更正。但是,似乎我们从无信息位点中推测出来的有信息位点的个数还有些少(1563/3282),大概占到47%。所以说,转移概率矩阵分析能够在一定程度上预测无信息位点的真实存在状态,也能够得到一个比较准确的位点缺失的概率。由于估计出的无信息位点的原因,所以也增加了很多小片段的缺失,而且有很多无信息位点并没有估计出来它的真实的状态,所以致使推出的分布曲线与模拟时使用的理论长度分布并不能完全吻合,但是我们还是能从分布图中看出有符合相同分布的趋势。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 文献综述
  • 1.1 染色体畸变
  • 1.1.1 染色体畸变的定义
  • 1.1.2 染色体畸变的发现
  • 1.1.3 染色体畸变的分类
  • 1.1.4 染色体畸变的原因
  • 1.1.5 染色体结构畸变的机理
  • 1.1.6 染色体畸变的应用
  • 1.2 等位基因缺失
  • 1.2.1 杂合性缺失
  • 1.2.2 杂合性缺失与肿瘤发生的关系
  • 1.2.3 杂合性缺失检测
  • 1.2.4 杂合性缺失检测的生物学意义
  • 第二章 材料和方法
  • 2.1 数据的获取
  • 2.2 方法
  • 2.2.1 等位基因缺失长度的计算
  • 2.2.2 统计学假设检验和模拟拟合
  • 2 拟合检验'>2.2.3 χ2拟合检验
  • 2.3 马尔科夫预测方法
  • 2.3.1 马尔可夫预测法基本原理
  • 2.3.2 状态和状态转移
  • 2.3.3 马尔可夫过程
  • 2.3.4 转移概率和转移概率矩阵
  • 2.4 发生缺失染色体的模拟
  • 第三章 结果与讨论
  • 3.1 结果
  • 3.2 讨论
  • 第四章 结论
  • 参考文献
  • 论文附录
  • 致谢
  • 作者简介
  • 相关论文文献

    • [1].儿童自然缺失症的现状及成因——基于河南省X市的实证分析[J]. 陕西学前师范学院学报 2020(05)
    • [2].缺失诚信的代价[J]. 招标与投标 2019(01)
    • [3].功效之失,采购之殇[J]. 中国药店 2018(06)
    • [4].论社会友善的缺失及其化解[J]. 理论导刊 2017(07)
    • [5].浅析高校中国画教学中的文化缺失现象[J]. 美术教育研究 2017(17)
    • [6].90后大学生孝道缺失现状及成因分析[J]. 科教导刊(中旬刊) 2017(09)
    • [7].缺失[J]. 美术教育研究 2016(04)
    • [8].探究父爱缺失下留守中小学生的人格发展[J]. 考试周刊 2020(77)
    • [9].缺失的美[J]. 意林 2019(24)
    • [10].论高校校园田径文化的缺失与唤醒[J]. 体育风尚 2018(08)
    • [11].《睡眠缺失》[J]. 中国美术研究 2018(01)
    • [12].缺失[J]. 杂文选刊 2017(10)
    • [13].国考“双降一升”,多少疑问待解[J]. 现代青年(细节版) 2014(12)
    • [14].保持事物的完整[J]. 今日中学生 2015(10)
    • [15].浅析边疆地区语文课缺失的本真[J]. 课程教材教学研究(中教研究) 2014(Z1)
    • [16].缺失的圆[J]. 诗潮 2011(11)
    • [17].中国文化视野下的大学生创新思维的缺失[J]. 中国科教创新导刊 2008(03)
    • [18].面对缺失现象,我们该教给孩子些什么?[J]. 好家长 2008(18)
    • [19].新形势下体育赛事诚信缺失现状与机制路径研究[J]. 体育科技文献通报 2020(05)
    • [20].大学生感恩意识缺失的现状及成因分析[J]. 大众科技 2016(10)
    • [21].浅谈大学生诚信缺失的问题[J]. 长江丛刊 2020(06)
    • [22].从可表演性原则谈戏剧翻译中文化缺失现象[J]. 语文学刊(外语教育教学) 2013(12)
    • [23].实践视域中经贸翻译的文化缺失及应对措施[J]. 佳木斯教育学院学报 2013(12)
    • [24].克服教学缺失与过度教学,打造高效课堂[J]. 学园 2013(18)
    • [25].缺失“雅”的时代[J]. 青少年书法 2010(08)
    • [26].教师教育公平观念的缺失[J]. 四川教育 2011(09)
    • [27].探析会计诚信缺失的原因及对策[J]. 现代经济信息 2013(12)
    • [28].缺失[J]. 教育科学论坛 2013(07)
    • [29].论高校反腐倡廉制度执行中的理性缺失问题[J]. 职业时空 2012(09)
    • [30].大学生诚信缺失的对策研究[J]. 华商 2008(15)

    标签:;  ;  ;  ;  ;  

    肿瘤患者等位基因缺失长度分布及无信息位点状态预测的研究
    下载Doc文档

    猜你喜欢