基于GWAS的候选基因遗传变异与结直肠癌遗传易感性的研究

基于GWAS的候选基因遗传变异与结直肠癌遗传易感性的研究

论文摘要

研究背景及目的结直肠癌是世界范围内常见的恶性肿瘤之一,全球每年约有100万新发病例,并且约有超过50万人因结直肠癌而死亡。在过去,我国是传统的结直肠癌低发国家,但近年来,随着生活方式和饮食习惯的改变,结直肠癌发病及死亡均快速攀升,成为严重威胁人群生命健康的公共卫生问题。结直肠癌的发病机制尚未完全阐明,但病因学研究已经表明,绝大部分结直肠癌的发生是一个多步骤、多阶段、环境因素和遗传因素共同作用的复杂过程。尽管研究已表明环境因素对于结直肠癌发病的重要性,然而接触相同的环境危险因素却只有极少数个体发生肿瘤,说明环境因素是结直肠癌发生的始动因素,而个体的遗传特征则决定了对结直肠癌的易感性。因此,对结直肠癌遗传易感因素进行系统的研究,寻找结直肠癌高风险基因或位点,对于实现结直肠癌的有效预防和早期诊断具有重大的实际意义。流行病学研究证实绝大部分结直肠癌的遗传易感性与为数众多的低外显性基因相关,这一机制使得鉴定与结直肠癌相关的基因或位点成为难点和热点。随着人类基因组计划的完成和单体型图谱的构建,以及高通量基因分型技术的快速发展,全基因组关联性研究应势而生,并成为目前探索复杂疾病易感性遗传因素最为有效的方法。GWAS研究也已经对结直肠癌遗传易感性位点进行了探索[1-8],并确定了10个与结直肠癌发病风险密切相关的常见低外显性单核苷酸多态性位点,包括rs16892766(8q23.3)、rs6983267 (8q24.21)、rs10795668(10p14)、rs4444235 (14q22, BMP4)、rs961253 (20pl2.3)、rs10411210 (19q13.1, RHPN2)、rs3802842 (11q23)、rs4779584 (15q13.3)、rs9929218 (16q22.1, CDH1)、rs4939827 SMAD7)。但目前的关于结直肠癌的全基因组关联性研究以及后续的验证性研究大部分都是在欧美人群中进行的,而在中国人群中关于结直肠癌全基因组关联性研究尚未见报道,并且在中国人群中对目前GWAS所识别的10个多态性位点的重复性研究仅有中国香港以及北京人群的两篇报道。此外,目前关与结直肠癌的GWAS研究仅是基于单位点分析逐一检验单个位点的边际效应,未涉及基因-基因之间交互效应的分析,且尚未有研究分析在中国人群中对已有的GWAS识别的10个多态性位点之间的交互作用。鉴于结直肠癌的发病是受多个基因以及环境因素的影响,本研究在中国汉族人群中目前GWAS研究所识别的10个结直肠癌易感性位点进行分析,并且采用多种不同原理的统计学方法对该10个位点之间的基因-基因交互作用进行评估,为结直肠癌的病因研究提供流行病学线索,为结直肠癌防治措施的制定提供科学依据。研究对象与方法研究采用基于医院的病例-对照研究设计,选择性别、年龄频率匹配的对照和病例,收集研究对象的基本信息以及病例的临床病理信息。在研究对象知情同意情况下收集每位对象外周静脉血5m1,采用天根生化科技(北京)有限公司的RelaxGene血液基因组DNA提取系统提取DNA,应用中通量sequenome分型技术对该10个多态进行检测。采用非条件logistic回归模型分析各个多态性位点基因型与结直肠癌发病风险的关联性。应用MDR、CART以及logistic回归对潜在的基因-基因交互作用进行挖掘。此外,我们对单位点分析中有意义的多态位点构建结直肠癌遗传风险分值模型。结果病例组和对照组的人口学特征分布无统计学差异。除rs16892766位点在本研究人群中未检测到多态突变外,其他九个多态性位点包括rs6983267、rs10795668、rs4444235、rs961253、rs10411210、rs3802842、rs4779584、rs9929218、rs4939827的各个基因型在对照人群中的分布均符合Hardy-Weinberg平衡。在单位点分析中,rs6983267位点的GG基因型携带者结直肠风险比TT基因型携带者增加了1.67倍(95% CI,1.27-2.19)。rs4939827位点TT基因型携带者结直肠发病风险是CC基因型携带者的1.57倍(95% CI,1.27-1.94),并且在显性模型中,T等位基因携带者与高结直肠癌发病风险显著相关(OR=1.46;95% CI,1.19-1.80)。在隐性模型中,rs4779584的TT基因型与结直肠癌高风险相关(OR=1.46;95% CI,1.18-1.80)。rs3802842的AC杂合子携带者结直肠癌发生风险增加了1.76倍(95% CI,1.40-2.22),CC基因型携带者风险增加了1.99倍(95% CI,1.48-2.66),且在显性模型中AC和CC合并基因型也与高风险显著相关(OR=1.82;95% CI,1.46-2.26)。rs961253位点中至少携带一个A等位基因的个体结直肠癌风险比CC基因型个体增加了1.62倍(95% CI,1.26-2.08)。余下四个多态性位点无论是在总体分析还是在性别、年龄以及临床病理因素分层分析中均未观察到与结直肠癌发病风险的统计学关联。基因-基因交互作用分析中,MDR的最佳交互作用模型是包括了rs6983267、rs3802842和rs4939827多态的3因子模型,模型预测准确率和交叉验证一致性均为所有因子模型中最高((TA=0.5858; CVC=10/10; Permutation P<0.001)),而包括rs6983267、rs961253、rs3802842和rs4939827的四因子模型预测准确率次之(TA=0.5722),并且交叉验证一致性也为10次,置换检验亦有统计学意义。CART分析中,rs3802842的AA基因型个体结直肠癌风险最低(预测发病概率=29.1%),以rs3802842 AA基因型携带者作为参照,终末结点10的个体携带了rs3802842 AC+CC, rs4939827 (CC), rs6983267 (TG+GG), rs961253 (CA+AA)基因型,其结直肠癌风险为所有研究对象中最高(OR=3.03;95% CI,1.93-4.79)。此外,对MDR以及CART识别的rs6983267、rs961253、rs3802842和rs4939827四个多态的联合效应进行了分析,分别以rs3802842 C等位基因、rs4939827 T等位基因、rs6983267 G等位基因和rs961253 A等位基因定义为危险等位基因,与未携带任何危险等位基因个体相比较,携带2个危险等位基因的个体结直肠癌风险增加了1.69倍(95% CI,1.05-2.71),携带3个危险等位基因个体风险增加了2.22倍(95% CI,1.37-3.58),而携带4个及以上危险等位基因的个体具有最高的结直肠癌风险(95% CI,1.90-5.20),并且趋势检验具有统计学意义(P for trend=4.516×10-14)。MDR、CART以及logistic回归的联合分析结果显示,rs6983267、rs961253、rs3802842和rs4939827存在显著的基因-基因交互作用。结论rs6983267、rs961253、rs3802842、rs4779584、rs493982多态性位点与中国汉族人群结直肠癌患病风险显著相关,并且rs6983267、rs961253、rs3802842和rs4939827之间的交互作用可能对结直肠的发病风险产生重要影响。结直肠癌的发生发展是一个多基因、多种环境因素相互作用的复杂过程,利用基于不同原理的多种统计学分析方法互相弥补之间的缺点,对基因-基因交互作用深入挖掘,将有助于阐明结直肠癌发病的遗传基础。

论文目录

  • 致谢
  • 中文摘要
  • Abstract
  • 缩写、符号清单、术语表
  • 插图和附表清单
  • 目录
  • 前言
  • 材料与方法
  • 结果
  • 讨论
  • 结论
  • 参考文献
  • 综述
  • 参考文献
  • 作者简历
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于GWAS的候选基因遗传变异与结直肠癌遗传易感性的研究
    下载Doc文档

    猜你喜欢