多水平logistic模型及其在流行病学调查数据中的应用

多水平logistic模型及其在流行病学调查数据中的应用

论文摘要

目的:探讨多水平logistic模型的基本理论及其在流行病学调查数据上的应用,旨在研究多水平logistic模型在实际应用过程中的方法学问题,为以后层次结构数据的有效分析提供参考。方法:在流行病学中常常存在层次结构数据,这种数据的特性为组群间差异较大,而组群内的成员间趋向于一致,即呈现一定的聚集性。这时,传统模型中数据间关于相互独立和方差齐的假定有可能不成立。多水平logistic模型在处理结构数据时考虑到了数据的层次性和聚集性,其基本思想是将总残差分解到相应的各个水平,其中高水平单位之间的变异表示组间变异,低水平单位间的变异表示个体间差异,将各水平残差表示为某些变量的函数,从而可分析其影响因素及变化趋势。多水平logistic模型与一般logistic回归模型的区别是:前者可以很好地处理存在组内聚集性的数据,可同时测量个体水平变异和组水平变异,可同时考虑固定效应和随机效应,还可研究场景变量对于组群单位的影响,而这些都是后者不能分析和解决的。本研究的主要内容包括多水平logistic模型理论的基本原理与方法、实例拟合过程(包括深圳市社区居民健康状况调查和广州市居民吸烟情况调查数据)、分析步骤、方法比较及结果解释等。本研究的数据预处理采用SAS9.2软件,多水平模型分析采用MLwiN和SAS9.2软件,数据缺失值采用SAS9.2的MI过程进行处理。结果:实例应用表明多水平模型在处理层次结构数据时,能够解决其有数据层次性、聚集性的问题,并且能够根据专业知识和实际情况将解释变量处理为固定效应或者随机效应,从而能够得到更丰富,更全面的结果。将多水平模型与筛选变量后的logitistic回归模型进行比较,前者的标准误比后者更小,统计效果更显著,且对于结果比后者有更合理的解释性。将缺失值进行多元填补后,能够得到比原始数据更可靠的结果。结论:多水平logistic模型理论在处理二分类层次结构数据时,提供了比传统模型更接近于客观情况的丰富信息。一般logistic回归模型简单易行,但只能研究个体层面的信息和其固定效应,无法分析组群方面信息和哪些因素对结局变量的变异程度有影响,而且当数据存在聚集性时会出现偏误,并且对于结果不能给出合理的解释;多水平logistic模型充分考虑了数据间的相关性问题,可考虑层次信息,并且能够同时研究个体变异和组间变异,能够分析固体效应和随机效应,对研究因素可做出准确的估计和假设检验。但是,多水平模型也有一定的局限性,如多水平模型要求低级水平和高级水平的残差方差服从正态分布或多元正态分布,参数估计较复杂,等等。另外,有层次结构的数据不一定需要做多水平模型分析,首先要看其组内相关性的大小,即是否存在组内聚集性,如果不存在数据聚集性,则用一般统计模型就可以了。在实际应用中,要结合专业知识和数据特征来选择合适的统计方法。忽略层次结构数据的组群效应,将会以损失资料信息的完整性为代价,使统计结果失效,并有可能得出错误的结论。因此,在有层次结构的流行病学调查数据中,多水平logistic模型是一个很好的选择,随着多水平logistic模型理论的完善和成熟,多水平logistic模型在流行病学领域中将会有更大的优势和更广阔的应用前景。

论文目录

  • 中文摘要
  • Abstract
  • 1 前言
  • 1.1 国外研究进展
  • 1.2 国内研究进展
  • 1.3 软件应用
  • 1.4 国内研究待解决问题
  • 1.5 研究目的
  • 1.6 选题意义
  • 2 原理与方法
  • 2.1 层次结构数据
  • 2.1.1 层次结构数据概念及内涵
  • 2.1.2 层次结构数据分析中容易出现的问题
  • 2.2 流行性学调查特征
  • 2.2.1 流行病学调查分类
  • 2.2.2 流行病学调查数据特征
  • 2.3 二分类结局变量多水平模型
  • 2.3.1 广义混合线性模型
  • 2.3.2 多水平logistic 模型
  • 2.3.3 模型假设
  • 2.3.4 组内相关系数ICC 和方差分配系数VPC
  • 2.3.5 空模型
  • 2.3.6 固定模型和随机模型
  • 2.3.7 参数估计
  • 2.3.8 模型检验
  • 2.3.9 模型拟合及残差检验
  • 2.4 缺失数据的处理
  • 2.4.1 缺失值产生原因
  • 2.4.2 缺失值的处理方法
  • 2.5 软件应用
  • 3 实例应用
  • 3.1 深圳市居民健康状况调查的多水平模型的应用
  • 3.1.1 数据来源
  • 3.1.2 数据预处理和格式
  • 3.1.3 分析结果
  • 3.2 广州市居民吸烟现况调查的多水平模型的应用
  • 3.2.1 数据来源
  • 3.2.2 数据预处理
  • 3.2.3 数据分析结果
  • 3.3 填补前数据和填补后数据多水平模型比较
  • 4 讨论
  • 4.1 多水平logistic 模型在流行病学的应用
  • 4.1.1 深圳市社区居民健康调查
  • 4.1.2 广州市居民吸烟现况调查
  • 4.1.3 总结
  • 4.2 多水平模型的用途
  • 4.3 多水平模型的优点及局限性
  • 4.3.1 多水平模型的优点
  • 4.3.2 多水平模型的局限性
  • 4.4 多水平模型的问题探讨
  • 4.4.1 数据中心化
  • 4.4.2 参数估计方法的选用
  • 4.4.3 收缩估计
  • 4.5 缺失值及填补数据在数据分析的应用
  • 4.6 有待进一步研究问题
  • 4.7 结论
  • 参考文献
  • 附录1 四种VPC 方法
  • 附录2 PQL 和MQL 法
  • 附录3 SAS 程序
  • 附录4 模型线性法和模拟法VPC 的MLwiN 软件程序
  • 综述
  • 参考文献
  • 攻读硕士期间发表论文
  • 致谢
  • 相关论文文献

    • [1].肺炎支原体感染并发消化系统损害患儿的有关特征及发病因素的Logistic回归分析[J]. 中国中西医结合消化杂志 2019(12)
    • [2].人工神经网络、极端梯度提升和Logistic回归用于预测再次剖宫产术中输血的比较分析[J]. 第三军医大学学报 2019(24)
    • [3].基于logistic回归模型的大学生月经不调影响因素分析[J]. 实用妇科内分泌电子杂志 2019(32)
    • [4].信息披露质量高还是低的上市公司更可能被举牌?——基于Logistic模型的实证研究[J]. 长春理工大学学报(社会科学版) 2019(06)
    • [5].复发性脑梗死危险因素的logistic回归分析[J]. 中国医院统计 2019(06)
    • [6].基于Logistic关联分析的水资源承载力评价[J]. 人民黄河 2019(12)
    • [7].基于Logistic回归模型的设施番茄病毒病预警模型构建[J]. 河北农业科学 2019(05)
    • [8].老年脑白质病变合并甲状腺功能减退病人常规生化指标的Logistic回归分析[J]. 中西医结合心脑血管病杂志 2019(23)
    • [9].我院监护仪报警疲劳的多因素Logistic回归分析及改进对策[J]. 中国医疗设备 2020(01)
    • [10].腹腔镜阑尾切除术后住院时间影响因素的Logistic回归分析[J]. 中国数字医学 2020(01)
    • [11].基于Logistic回归模型的小学生上网研究[J]. 教育教学论坛 2020(02)
    • [12].金融街社区重点人群家庭医生签约服务状况调查及影响因素logistic分析[J]. 中国社区医师 2020(03)
    • [13].带有约束条件的四参数Logistic曲线分析在干扰素生物学活性检定中的应用[J]. 中国生物制品学杂志 2020(03)
    • [14].基于Logistic模型的步石满意度影响因素研究[J]. 山东农业大学学报(自然科学版) 2020(01)
    • [15].基于中医体质失眠影响因素的Logistic回归分析[J]. 中国中西医结合杂志 2020(03)
    • [16].他汀药物治疗依从性相关因素Logistic回归分析[J]. 首都食品与医药 2020(07)
    • [17].基本医疗保险制度满意度影响因素与优化路径探讨——基于Logistic模型[J]. 劳动保障世界 2020(09)
    • [18].非条件Logistic回归模型于早期应力性骨折诊断中应用效果研究[J]. 临床军医杂志 2020(03)
    • [19].攀西地区成年女性子宫肌瘤影响因素的Logistic分析[J]. 西南军医 2020(01)
    • [20].广西18岁及以上居民血脂异常现况及其膳食影响多因素logistic回归分析[J]. 应用预防医学 2020(01)
    • [21].新生儿呼吸窘迫综合征合并呼吸机相关性肺炎患儿死亡相关因素Logistic回归分析[J]. 湖北民族大学学报(医学版) 2020(01)
    • [22].透析患者自体动静脉内瘘使用中初次失功影响因素的logistic分析及干预[J]. 黑龙江医学 2020(01)
    • [23].肥城市农村居民食管癌及癌前病变危险因素多元有序Logistic回归分析[J]. 中华肿瘤防治杂志 2020(07)
    • [24].手足口病患儿并发脑膜炎危险因素的Logistic回归分析[J]. 中国现代医生 2020(07)
    • [25].基于Logistic模型的农户土地规模经营意愿分析[J]. 统计与决策 2020(02)
    • [26].基于有序多分类Logistic回归的物业服务收费满意度及影响因素研究[J]. 住宅与房地产 2020(04)
    • [27].基于Logistic模型的干、湿环境下江淮夏季雷暴大风潜势预报研究[J]. 气象科学 2020(02)
    • [28].乳腺导管内原位癌与乳腺导管内乳头状瘤超声鉴别诊断logistic回归分析[J]. 广东化工 2020(07)
    • [29].视力残疾人康复需求和康复服务发展状况Logistic回归分析研究[J]. 中国康复理论与实践 2020(05)
    • [30].智力残疾人康复需求与康复服务发展状况Logistic回归分析研究[J]. 中国康复理论与实践 2020(05)

    标签:;  ;  ;  ;  ;  ;  

    多水平logistic模型及其在流行病学调查数据中的应用
    下载Doc文档

    猜你喜欢