论文摘要
第一部分中国汉族人群中ACE2基因多态和冠心病及心肌梗塞的关联研究越来越多的证据显示ACE2(血管紧张素转换酶2)可能是对心血管具有保护性作用的蛋白;但是相应的人群研究却很少。因此我们进行了一项病例对照研究,考察ACE2基因多态和CHD(冠心病)以及MI(心肌梗塞)的关系。在中国汉族人群中,选取了811名CHD病例(其中508名是MI病例)和905名正常对照,通过PCR-RFLP方法鉴定了三个ACE2基因单核苷酸多态位点(1075A/G、8790A/G和16854G/C)的基因型。这些位点间存在连锁不平衡(r2,0.854~0.973)。由于ACE2基因处在X染色体上,统计分析根据不同的性别进行。在女性中,校正环境变量后发现1075A/G(P=0.026,OR=1.98)和16854G/C(P=0.028,OR=1.97)两个位点在隐形模型下和MI相关联。在男性中有两种常见的单体型——AAG和GGC。不饮酒的男性个体中,和最常见的单体型AAG的携带者相比,在校正环境因素后携带单体型GGC的个体具有1.76倍的CHD患病风险(95%可信区间是1.15-2.69;P=0.007),以及1.77倍的MI患病风险(95%可信区间是1.12-2.81,P=0.015)。总之,上述结果表明ACE2基因的常见变异可能影响女性MI的发生,它可能与饮酒存在交互作用影响中国男性CHD和MI的患病风险。第二部分全基因组关联研究中的通路分析方法全基因组关联(GWA)分析是复杂疾病遗传学研究的革命性进展。目前的研究一般使用单位点分析方法,报告最显著的关联位点和相关基因。由于检验的位点数目众多,遗传背景噪声过多,单位点分析存在一些局限。Wang等人首次将基因表达分析中的通路研究方法GSEA(Gene set enrichment analysis)应用于全基因组关联分析,作为传统单位点分析的补充。但是他们采用一个基因内所有SNP关联统计量的最大值来衡量基因和疾病的关联程度。这种方法受到了基因内部位点数目和局部连锁不平衡的影响,位点数目较多或LD较弱的基因会得到较大的关联统计量,可能在分析中造成偏倚。若在此基础上综合多个基因的统计量来分析基因集合的显著性,检验统计把握度也会受到影响。我们提出VSEA(Variable set enrichment analysis)方法,采用多种方案更加合理地计算基因和疾病关联的统计量,以改进GSEA方法使之更适合全基因组关联数据分析。各种VSEA算法通过模拟数据进行了检验,并在小型全基因组关联数据(LVH前导性研究)中得到了测试。结果显示,采用校正的基因关联统计量后,使用CHI2和类似算法的VSEA方法与Wang的GSEA相比得到了很大的改进;其他一些算法(如基于主成份分析的算法)也显示出一定的潜力。VSEA方法可以作为全基因组关联数据分析中传统统计分析方法的有效补充,为复杂疾病的GWA数据的解释提供更多的帮助。
论文目录
相关论文文献
标签:关联研究论文; 血管紧张素转换酶论文; 冠心病论文; 性别论文; 心肌梗塞论文; 单核苷酸多态论文; 全基因组关联研究论文; 生物通路论文; 基因集合论文; 统计方法论文;