论文摘要
复杂疾病已成为当今社会的常见病和人类的主要死因。对复杂疾病进行基因定位使用大家系得到的结论要比小家系可靠,且在疾病基因作图和标记基因作图中同时考虑多个连锁位点比较好,对小家系位点数目多和大家系位点数目少的问题已有有效的算法解决。前者使用Elston-Stewart 算法,是一种递归计算家系成员遗传信息的算法,以核心家系为单位从最低辈份至最高辈份计算,算完一个家系,削去一个;该算法使整个家系似然值的计算量随家系成员个数的增长呈线性增长,但随标记位点数目的增长呈指数级增长。后者采用Lander-Green 算法,是基于几个有序位点上遗传模式的隐马尔可夫链;该法使得家系中似然值的计算量随标记位点数目的增长呈线性增长,随家系成员个数的增长呈指数级增长。对大家系且位点数目多,特别又存在缺失数据时,上述算法在计算机计算时间和内存上遇到困难。本文中即将介绍的序贯归因法可解决这一难题。序贯归因法是应用传统重要抽样技术的一种新的蒙特卡洛方法,即基于一个固定参数值,缺失数据可根据观察得到的数据估计出来,可用于多位点似然值的计算。一次可计算一个(或几个)位点这样就可减少计算所需要的计算机存储和计算时间,最终产生完全数据集以及相关的权重集合,可利用权重估计似然函数的参数值。序贯归因法适用于大家系多位点且含有潜在缺失数据的连锁分析。对早发性乳腺癌家系进行致病基因(BRCA1)的定位研究,该基因位于17q12-q21。采用序贯归因法、Elston-Stewart 算法、Lander-Green 算法进行多位点连锁分析。Elston-Stewart 算法只能分析部分标记和部分等位基因,Lander-Green 算法自动删去家系中22.22%和55%的非奠基者进行分析,而序贯归因法可对整个家系数据进行分析。结果显示用序贯归因法得出的结论比Lander-Green 算法和Elaton-Stwart 算法得出的结论更真实。
论文目录
相关论文文献
- [1].论量化研究中缺失数据的处理方法[J]. 教育测量与评价(理论版) 2012(07)
- [2].城市间住宅享乐价格指数及其实证研究[J]. 科教导刊(中旬刊) 2010(07)
- [3].业绩归因分析在审计风险识别中的应用[J]. 商场现代化 2015(27)
- [4].反思性中学英语教师的特征研究[J]. 池州学院学报 2014(05)
- [5].民族村寨旅游利益博弈下的环境问题研究——以四川甲居藏寨为例[J]. 干旱区资源与环境 2014(02)
- [6].资源堆积的亏损[J]. IT经理世界 2009(20)