广义线性混合效应模型(GLMM)与复杂抽样的logistic回归模型在分层整群抽样数据分析中的比较

广义线性混合效应模型(GLMM)与复杂抽样的logistic回归模型在分层整群抽样数据分析中的比较

论文摘要

在公共卫生领域的抽样调查中为了减少抽样误差,提高抽样的精度,经常会采用如分层整群抽样这类复杂的抽样方法。由于这类抽样方法所得到数据往往是具有多层次的结构特点的,这就使得在同一较低层次的各个个体之间具有一定的相关性,即结局变量的分布在个体间不具备独立性。因而不满足传统的统计分析方法的应用条件,而多层统计分析模型和复杂抽样的统计分析方法均可以处理这类数据。目的研究和分析广义线性混合效应模型和复杂抽样的logistic回归方法在分层整群抽样数据中的应用,通过实例数据分析以及数据模拟的研究方法,结合国际通用统计分析软件SAS中相应的模块GLIMMIX与SURVEY模块来进行这两种方法在分层整群抽样数据中的比较应用。并通过改变模拟数据的参数组合,来比较在不同的内部相关系数(ICC),给定个体水平变量系数,抽样比以及样本量的情况下二者的适用性。同时,为了验证传统的统计分析方法在分层整群抽样数据分析中的局限性,也将传统的logistic回归模型纳入到比较分析中。方法首先将三种统计方法应用到实例数据的分析中,参考其分析结果设定模拟数据的参数值。数据模拟分两个部分:模拟一研究,模拟还原实例数据的总体,并从中进行分层整群抽样,模拟抽样1000次,对每一次抽样的数据分别应用logistic回归模型,复杂抽样的logistic回归模型以及广义线性混合效应模型三种方法进行分析;模拟二研究,在模拟一研究的基础上,改变模拟的参数:各层的内部相关系数ICC,给定个体水平变量系数以及不同的抽样比来比较这三种方法的适用性,模拟次数1000次。两个阶段的模拟评价指标为:第1类错误率,偏倚,95%可信区间覆盖率,功效以及标准误。结果实例数据的分析中,在应用surveylogistic回归(surveylogistic)与广义线性混合效应模型(GLMM)进行调整后,各回归系数的标准误都比logistic回归中的标准误大,且各危险因素的OR值的95%可信区间较logistic回归都有不同程度的增宽。数据模拟分析中,surveylogistic和GLMM对分析结果的影响,主要体现在组群水平(即宏观层次)的变量上。从模拟评价指标来看:在第1类错误的控制上,GLMM表现最强,surveylogistic在组群水平变量上表现的与GLMM一致,但是在个体水平变量上,却是三种方法上最差的。当人数多的一层的ICC为0.1,人数少的一层的ICC为0.5,抽样比是按相同抽样概率抽样时,应用surveylogistic回归模型对个体水平变量第1类错误率影响最大。随着人数多的一层的ICC增大,组群水平变量的第1类错误率会增高。95%可信区间覆盖率最高的是GLMM,无论在个体水平还是组群水平变量上,最差的是logistic回归,同时,95%可信区间覆盖率还受抽样比和给定个体水平变量的系数的影响,且人数多的一层的ICC和方法形成交互作用影响95%可信区间覆盖率。三种统计方法对个体水平和组群水平变量的偏倚的影响差异不大,相比之下,GLMM比其他两种方法对偏倚的影响要大。结论传统的logistic回归方法在分层整群抽样数据中应用是受到限制的。在做这类数据分析时,我们可以从两个角度去考虑分析:在个体水平变量上,最好的方法是GLMM,而如果应用传统的logistic回归方法在两层ICC都不大的情况下,也不会出现大的问题,不建议使用复杂抽样的logistic回归;但是,在组群水平变量的问题上时,传统的logistic回归方法会造成参数估计的标准误被低估,从而使得其显著性检验过于宽松,这种情况下,GLMM和复杂抽样的logistic回归更加适用,但如果考虑到计算的简便省时,并且抽样框信息齐全的情况下,推荐使用复杂抽样的logistic回归。

论文目录

  • 中文摘要
  • 英文摘要
  • 第一章 绪论
  • 1. 分层整群抽样的背景及特点
  • 1.1 分层整群抽样背景
  • 1.2 分层整群抽样的特点
  • 2. 分层整群抽样数据统计分析方法回顾
  • 3. 研究设想
  • 第二章 原理和方法
  • 1 抽样技术
  • 1.1 抽样技术基本概念
  • 1.2 分层整群抽样原理
  • 2 传统统计分析方法——固定效应logistic回归模型
  • 3 复杂抽样的logistic回归模型
  • 4 广义线性混合效应模型(GLMM)
  • 5 模拟研究
  • 第三章 实例分析
  • 1 引言
  • 2 模型的介绍及其应用
  • 3 实例的流行病学研究
  • 4 实例分析
  • 第四章 模拟研究结果
  • 1 引言
  • 2 模拟一研究
  • 3 模拟二研究
  • 4 小结
  • 第五章 总结和讨论
  • 1 广义线性混合效应模型模型的应用
  • 2 复杂抽样的logistic回归模型的应用
  • 3 存在的不足
  • 4 小结
  • 参考文献
  • 综述
  • 附录
  • 发表文章
  • 致谢
  • 相关论文文献

    • [1].境外森林资源调查分层整群抽样案例分析[J]. 林业建设 2015(04)
    • [2].境外森林资源调查分层整群抽样案例分析[J]. 林业资源管理 2015(04)
    • [3].甘肃大学毕业生就业倾向调查[J]. 发展 2008(12)
    • [4].分层整群随机抽样数据的不同分析方法及结果比较[J]. 中国卫生统计 2010(02)
    • [5].农村居民健康状况及卫生服务需求分层整群抽样调查[J]. 中国循证医学杂志 2008(08)
    • [6].医学生职业价值观现状及影响因素分析[J]. 管理观察 2017(11)
    • [7].基于分层整群抽样的江苏省农村家庭支出中食物支出的比重研究[J]. 中国证券期货 2011(12)
    • [8].SURVEYMEANS过程在抽样调查资料分析中的应用[J]. 四川精神卫生 2017(05)
    • [9].基于分层整群抽样法开展流行病学调查的中医研究概况[J]. 中国民族民间医药 2019(14)
    • [10].理科学不好,到底啥原因——来自一所中学内地新疆高中班的调查[J]. 中国民族教育 2015(04)
    • [11].某医学院大学生自认“超重”者减肥行为的现况分析[J]. 泸州医学院学报 2010(05)
    • [12].大学生吸烟行为调查及心理成因分析[J]. 科教导刊(上旬刊) 2012(04)
    • [13].江苏省老年人跌倒发生情况及危险因素分析[J]. 中华疾病控制杂志 2010(10)
    • [14].医学生医德教育问卷调查分析[J]. 新疆中医药 2016(04)
    • [15].媒体宣传对在校大学生美容选择的影响[J]. 中国美容医学 2017(03)
    • [16].家庭关怀度和抑郁对老年人健康自我老化感知影响[J]. 中国公共卫生 2018(01)
    • [17].护理本科生觉察压力的调查研究[J]. 农垦医学 2017(01)
    • [18].南昌小学教师疲劳与慢性疲劳综合征的调查报告[J]. 卫生研究 2013(01)
    • [19].大学生急救知识现况调查及干预[J]. 暨南大学学报(医学版) 2008(02)
    • [20].留守与非留守儿童心理弹性的对比研究[J]. 中学课程辅导(江苏教师) 2013(16)
    • [21].钢厂工人代谢综合征知晓率干预前后比较[J]. 科技经济市场 2016(05)
    • [22].苏州地区高中生与父母沟通状况调查分析[J]. 考试周刊 2012(01)
    • [23].高血压患者的心理健康及其影响因素[J]. 中国民族民间医药 2010(18)
    • [24].突发疫情下本科院校线上教学的调查研究[J]. 财富时代 2020(05)
    • [25].居家养老老年人日常生活活动能力及其影响因素[J]. 中国康复理论与实践 2012(04)
    • [26].辽宁某高校医学生抗菌药物认知水平调查[J]. 中国微生态学杂志 2014(07)
    • [27].455名女性居家非正式照护者自评健康状况及影响因素分析[J]. 中国卫生事业管理 2013(05)
    • [28].广东省高职院校学生手机依赖的调查分析——以广东工贸职业技术学院为例[J]. 现代职业教育 2019(22)
    • [29].两直辖市卫生监督机构人员流动情况分析[J]. 中国卫生监督杂志 2008(03)
    • [30].佳木斯市城区6~11岁小学生儿童忽视现况分析[J]. 中国儿童保健杂志 2015(03)

    标签:;  ;  ;  

    广义线性混合效应模型(GLMM)与复杂抽样的logistic回归模型在分层整群抽样数据分析中的比较
    下载Doc文档

    猜你喜欢