论文摘要
目的:运用决策树与logistic回归技术分别对城市与农村居民是否就诊与住院的影响因素进行多因素分析,以探讨决策树与回归技术结合应用于居民就医服务研究中的效果,了解城市与农村地区居民就医的主要影响因素,针对两类地区人群就医特点与影响因素采取不同的卫生政策,满足并优化城乡居民的就医需求,提高卫生服务的利用效率与公平性,为卫生服务决策提供依据。方法:采用第四次国家卫生服务调查——重庆西部扩点地区调查数据,通过SAS9.1和SPSS17.0统计软件进行数据整理与分析,根据变量类型选择CART和CHAID树增长法与二分类非条件Logistic回归分析法,分别构建城市、农村居民是否就诊及是否住院的决策树与回归模型,并对相应的决策树与回归模型的拟合效果与筛选的变量进行比较。结果:1.患者就诊情况及多因素分析:居民两周未就诊率为53.07%(城市51.79%、农村54.48%),男、女未就诊率分别为54.66%、52.58%,经卡方检验,城乡居民类型与性别对患者两周内是否就诊没有影响,年龄、职业类型、就业状况、文化程度、婚姻状况、医疗保险、是否慢病、最近就诊距离与自感病情等对患者两周内是否就诊均有影响(P<0.0001);53.07%的两周内未就诊患者中,17.1%的人是两周前就诊的,29.6%的人是采取纯自我治疗,还有9.5%的人未采取任何治疗措施。而从患者是否就诊的多因素分析结果来看,选择CART树模型作为城市患者就诊与否多因素分析的最终模型,CART树共5层、6个叶子节点,对应6条分类规则,模型的错误分类率为0.198,变量人均年收入、最近就诊距离、是否慢病、文化程度、年龄、职业类型、婚姻状况、医疗保险筛选入模型;从农村患者是否就诊的多因素分析结果来看,选择CHAID树作为多因素分析的最终模型,模型共3层、11个叶子节点,对应11条分类规则,模型的错误分类率为0.211,人均年收入、最近就诊距、自感病情、医疗保险与是否慢病筛选入模型。2.住院情况及多因素分析:该地区居民年未住院率为36.42%,经卡方检验,人均年收入、文化程度与医疗保险这三个变量对需住院患者是否住院有影响(P值分别为0.0365、0.0341、0.0047)。其中,三个收入等级人群中,低等收入水平患者的未住院率最高,为41.18%;文化程度不同人群中“没上过学”文化程度的人群未住院率最高,为41.83%;医疗保险参保人群中,参加“其它社会医疗保险”人群未住院率最高,为75%,公费医疗人群未住院率最低,为14.29%。从需住院患者是否住院的多因素分析结果来看,选择Logistic回归模型作为城市地区需住院患者是否住院多因素分析的最终模型,模型的错误分类率为0.220,变量文化程度筛选入模型;选择CHAID树模型作为农村地区需住院患者是否住院多因素分析的最终模型,模型共1层、2个叶子节点,对应2条分类规则,模型错误分类率为0.283,变量人均年收入筛选入模型。结论:1.调查地区超过一半的患者两周内没有就诊,未就诊率较高,年龄、职业类型、就业状况、文化程度、婚姻状况、医疗保险、是否慢病、最近就诊距离、自感病情几个变量对患者是否就诊有影响,而居民类型与性别对患者是否就诊没有影响;多因素分析结果显示:人均年收入、最近就诊距离、是否慢病、文化程度、年龄、职业类型、婚姻状况、医疗保险是影响城市患者是否就诊的主要因素,人均年收入、最近就诊距、自感病情、医疗保险与是否慢病是影响农村患者是否就诊的主要因素。2.该地区患者未住院率较高,达36.42%,其中,人均年收入、文化程度与医疗保险对患者是否住院有影响。多因素分析结果显示,文化程度是影响城市地区患者住院与否的主要因素,文化程度越高,城市居民未住院率越低;人均年收入是影响农村地区患者是否住院的主要因素,人均年收入为“低等水平”的患者选择住院的概率为51.6%,而人均年收入为“中等和高等收入水平”的患者选择住院的概率为65.4%,大于“低等收入”水平人群住院的可能性。3.经模型比较,在城乡患者就诊与否的多因素分析中,决策树模型的应用效果优于Logistic回归模型;而在患者住院与否的多因素分析中,城市地区Logistic回归模型应用效果优于决策树模型,农村地区决策树模型优于Logistic回归模型。