脾胃湿热证与气象要素相关性的数据挖掘初步研究

脾胃湿热证与气象要素相关性的数据挖掘初步研究

论文摘要

研究背景辨证论治是中医学最具特色的学科精华,也是中医诊断学的主要研究内容。中医辨证标准的研究,对于发展中医理论及提高临床诊治水平,具有极其重要的意义。目前,中医学缺乏标准的辨证规范,已经出现的中医辨证方法多采用统计方法和逻辑分析方法,但受人为经验因素的影响,难以摆脱传统的经验模式。随着信息科技进步,数据海量激增,数据挖掘技术应运而生。数据挖掘是从大量的、模糊的、随机的数据中,提取潜在有用的信息和知识的过程。数据挖掘技术在医学领域的运用已有十多年,为医学理论与临床科研的发展提供了科学方法,但在中医学的应用尚处于起步阶段。脾胃为后天之本,气血生化之源,关系到人体健康,乃至生命的存亡脾胃病在内科疾病中占有重要地位,脾胃湿热证是其常见证型,是一组能够比较集中地反映脾胃相关生理功能异常表现的综合症状群,可见于多系统多病种之中,因此,从脾胃湿热证入手进行脾胃疾病辨证诊断方法的现代研究是辨证论治研究的重要课题,探讨脾胃湿热证与相关因素的相关性,既有助于脾胃湿热证的科学辨证,又能为中医学的辨证论治提供参考。现有的诊断标准简单且不完善,缺乏统一标准,亟待定量化、客观化。运用数据挖掘技术对中医证候进行定量诊断是中医诊断学证候数字化、客观化研究的主流,在中医辨证论治的研究中,对加快有效信息转化为知识,促进中医学知识快速更新,有着非比寻常的意义。研究目的运用数据挖掘技术和相关算法对脾胃湿热证诊断相关症状进行客观量化,寻找出最有价值的诊断信息,再挖掘与气象要素的关联规则,既为气象要素与脾胃湿热证的相关性研究提供科研实践,又结合各症状的诊断贡献度,建立体现辩证论治规律的数学模型,为中医证候计量诊断的研究提供更多的参考。研究对象和方法本研究以临床信息和气象信息为研究对象,临床信息所选病例来自湖南中医药大学附属第一医院、第二医院、长沙市中医院。数据挖掘临床资料为2007年1月—12月三所医院的内科住院病例资料6578例,其中研究组脾胃湿热证1674例,对照组脾胃虚寒证1357例,肝胆湿热证826例,其他证2721例,男性3347例,女性3231例,平均年龄47.6岁,年龄最小16岁,最大84岁。数理统计资料为2007年1月—2009年12月三所医院门诊与病房的58248例内科患者。气象信息来自湖南省气候中心2007年1月—2009年12月气温、降水量、相对湿度、气压与风速五个要素的统计数据。模型检验临床资料为2010年1月—2010年12月三所医院门诊与病房的18872例内科患者,气象资料为湖南省气候中心2010年1月—2010年12月气温、降水量、相对湿度、气压与风速五个要素的统计数据。研究方法是建立病例调查表,项目包括姓名、性别、年龄、诊断以及与脾胃湿热证、脾胃虚寒证和肝胆湿热证相关的30个症状,即S1胃脘疼痛、S2少脘腹痞满、S3脘腹隐痛、S4胁肋胀痛、S5喜按喜温、S6嘈杂不适、S7面色苍白、s8身目发黄、s9口干口苦、S10渴不引饮、Sll烦热口渴、S12口淡不渴、S13纳呆呕恶、S14纳少便溏、S15大便臭秽、S16大便稀薄、S17肛门灼热、S18里急后重、S19体倦身重、S20形寒肢冷、S21肢体浮肿、S22身热不扬、S23小便短赤、S24舌红、S25舌淡、S26苔黄腻、S27苔白腻、S28脉滑数、S29脉弦数、S30脉沉细。数据库软件采用Microsoft Visual Foxpro 8.0,将观察表中的项目运用程序建立一个PATIENT. DBF的数据库文件。采用数据挖掘技术和数理统计方法计算与脾胃湿热证、脾胃虚寒证和肝胆湿热证相关的各个症状的诊断贡献率,取诊断贡献率最大的症状作为原始生成元再计算与原始生成元结合而构成的症状组的诊断贡献率。综合所得结果并通过对照观察,找出脾胃湿热证的五个主要诊断症状。运用研究结果选取基本满足研究要求的样本数,挖掘与之对应的气象要素的相关性,然后利用多元回归和最优子集回归等方法建立脾胃湿热证的预测模型。研究结果在脾胃湿热证中,根据症状的诊断贡献率,对证候诊断起主要作用的分别是:S28脉滑数(22.52)、S19体倦身重(11.53)、S24舌红(11.12)、S22身热不扬(10.26)和S26苔黄腻(8.57),根据症状组的诊断贡献率,对证候诊断起主要作用的分别是:S26 and S28(53.71)、S24 and S28(52.75)、S19 and S28(51.2)、S22 and S28(48.86)。在脾胃虚寒证中,根据症状的诊断贡献率,对证候诊断起主要作用的分别是:S12口淡不渴(21.45)、S27苔白腻(18.78)、S5喜按喜温(12.56)、S3脘腹隐痛(11.57)和S25舌淡(10.79),根据症状组的诊断贡献率,对证候诊断起主要作用的分别是:S27 and S12(51.13)、S25 and S12(50.57)、S5 and S12(49.16)、S3 and S12(48.01)。在肝胆湿热证中,根据症状的诊断贡献率,对证候诊断起主要作用的分别是:S24舌红(16.92)、S17肛门灼热(13.81)、S11烦热口渴(12.91)、S26苔黄腻(9.91)和S29脉弦数(8.96),根据症状组的诊断贡献率,对证候诊断起主要作用的分别是:S29 and S24(56.71)、S23 and S24(51.17)、S26 and S24(49.97)、S11 and S24(49.93)。脾胃湿热证五个主要诊断症状与五个气象要素相关系数:S28与气温、降水量、相对湿度、气压、风速五要素相关系数分别是:0.94、0.34、-0.26、-0.96、-0.02;S26与气温、降水量、相对湿度、气压、风速五要素相关系数分别是:0.93、0.31、-0.30、-0.95、-0.01;S24与气温、降水量、相对湿度、气压、风速五要素相关系数分别是:0.96、0.29、-0.30、-0.96、0.00;S19与气温、降水量、相对湿度、气压、风速五要素相关系数分别是:0.69、0.44、-0.23、-0.82、-0.21;S22与气温、降水量、相对湿度、气压、风速五要素相关系数分别是:0.69、0.46、-0.23、-0.82、-0.21。多元回归预测模型对于2010年脾胃湿热证的临床预测检验误差为3865例,最优子集回归预测模型对于2010年脾胃湿热证的临床预测检验误差为365例。结论对脾胃湿热证起主要诊断作用的症状是:S28脉滑数、S26苔黄腻、S24舌红、S19体倦身重和S22身热不扬。对脾胃虚寒证起主要诊断作用的症状是:S12口淡不渴、S27苔白腻、S5喜按喜温、S3脘腹隐痛和S25舌淡。对肝胆湿热证起主要诊断作用的症状是:S24舌红、S29脉弦数、S23小便短赤、S26苔黄腻和S11烦热口渴。研究组脾胃湿热组和对照组脾胃虚寒与肝胆湿热组结果具有显著差异性,得出关于脾胃湿热证诊断症状要素的结果具有特异性。五个主要诊断症状要素与气温、气压的相关最好,其中S28脉滑数、S26苔黄腻、S24舌红与气温、气压的相关系数最高,与风速的相关最差。最优子集回归方法对于脾胃湿热证的预报预测具有较好的效果。

论文目录

  • 中文摘要
  • 英文摘要
  • 引言
  • 第一章 文献研究
  • 1.1 辨证论治研究概述
  • 1.2 脾胃湿热证辨证论治的研究概述
  • 1.2.1 脾胃病的辨证论治研究
  • 1.2.2 脾胃湿热证的研究现状
  • 1.2.3 脾胃湿热证的实验与临床研究
  • 1.3 数据挖掘研究概述
  • 1.3.1 数据挖掘发展概况
  • 1.3.2 数据挖掘的概念
  • 1.3.3 数据挖掘的任务、方法与功能
  • 1.3.4 数据挖掘的步骤
  • 1.3.5 数据挖掘的特点
  • 1.3.6 中医学与数据挖掘研究概述
  • 1.4 预测模型研究概述
  • 第二章 研究资料和方法
  • 2.1 研究资料
  • 2.2 研究方法
  • 2.2.1 建立病例信息资料表
  • 2.2.2 建立数据库
  • 2.2.3 数据挖掘方法及算法
  • 2.2.3.1 诊断贡献率的计算
  • 2.2.3.2 症状概率、条件概率、诊断贡献率的计算
  • 2.2.4 主要症状的预测模型
  • 2.2.4.1 多元回归方法
  • 2.2.4.2 最优子集回归方法
  • 第三章 研究结果
  • 3.1 原始数据的分布特点
  • 3.1.1 一般资料的分布
  • 3.1.2 各症状、证型在全部统计病例中的分布
  • 3.2 各症状对脾胃湿热证、脾胃虚寒证、肝胆湿热证的诊断贡献率
  • 3.2.1 各症状对脾胃湿热证的诊断贡献率
  • 3.2.2 各症状对脾胃虚寒证的诊断贡献率
  • 3.2.3 各症状对肝胆湿热证的诊断贡献率
  • 3.3 各症状组的病例数、概率及条件概率
  • 3.3.1 脾胃湿热证各症状组的病例数、概率及条件概率
  • 3.3.2 脾胃虚寒证各症状组的病例数、概率及条件概率
  • 3.3.3 肝胆湿热证各症状组的病例数、概率及条件概率
  • 3.4 各症状组对脾胃湿热证的诊断贡献率
  • 3.4.1 各症状组对脾胃湿热证的诊断贡献率
  • 3.4.2 各症状组对脾胃虚寒证的诊断贡献率
  • 3.4.3 各症状组对肝胆湿热证的贡献率
  • 3.5 脾胃湿热证与气象要素的相关性研究
  • 3.5.1 脾胃湿热证主要症状诊断要素每月频数分布情况
  • 3.5.2 五个气象要素资料统计情况
  • 3.5.3 脾胃湿热证五个主要诊断症状要素与气象要素的相关性分析
  • 3.5.3.1 五个诊断症状要素与五个气象要素的相关系数
  • 3.5.3.2 五个诊断症状要素的多元线性回归计算
  • 3.5.3.3 五个症状诊断要素的最优子集回归计算
  • 3.5.3.4 2010年五个症状诊断要素预测模型检验
  • 第四章 分析与讨论
  • 4.1 脾胃湿热证的发病人群分布特点
  • 4.2 脾胃湿热证诊断指标的科学择取
  • 4.3 研究方法的合理选用
  • 4.4 本研究对脾胃湿热证诊断的意义
  • 4.5 本研究对中医诊断研究的启示
  • 4.5.1 建立诊断定量化标准是辨证论治研究发展的科学途径
  • 4.5.2 中医学与多学科的科学结合有利于自身发展
  • 4.6 中医辨证论治的发展展望
  • 4.7 不同预报模型的检验效果
  • 第五章 研究结论
  • 5.1 研究组与对照组的诊断结论
  • 5.2 脾胃湿热证主要症状诊断要素与气象要素的相关性
  • 5.3 脾胃湿热证的科学预测方法
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  

    脾胃湿热证与气象要素相关性的数据挖掘初步研究
    下载Doc文档

    猜你喜欢