论文摘要
随着科学技术的迅猛发展,各种先进的医疗检测设备不断涌现,医院信息化建设也在不断完善,为我们积累了大量珍贵的医学资料。然而,面对如此海量的数据,仅凭专家、医生的个人能力已不足以充分分析、总结蕴涵在其中的知识以辅助诊断。而数据挖掘作为一种知识获取技术以其本身的特性解决了知识自动获取这一难题,并充分利用了医疗信息化平台积累的大量数据;因而将数据挖掘技术引入计算机辅助医学诊断系统,实现知识的自动获取,将会极大的推动计算机辅助医学诊断的发展,形成一个具有广阔发展前景的领域。本文首先对数据挖掘技术做了概述,并对其中的关联规则做了详细分析。针对实际医学数据多为多值的情况,对原有布尔关联算法做了改进,得到针对多值属性的关联规则挖掘方法。该方法是受粗糙集区分矩阵思想的启发,先给出相似属性集合矩阵的概念并构造相似矩阵,然后遍历该矩阵得到候选频繁项及其所属事务集合,最终产生关联规则;这样无须进行多值到布尔值类型的转化,即可直接应用于多值属性的关联规则挖掘。由于在求解候选频繁项的同时也得到其所属事务集合,于是在数据内容发生变化时,只需要对增量部分数据进行挖掘,并修改相应候选频繁项所属的事务集合,即可求得变化后数据集下的频繁项,进而求出关联规则,形成一种增量式关联规则更新算法:这样在无需对全部数据集重新操作的情况下求得关联规则,提高了效率;实现了快速、准确的增量式关联挖掘,并从理论和实验两个方面验证了算法的有效性。最后,构建了一个用于医学诊断的数据挖掘规则提取平台,并对该平台从分析、设计到实现做了详细的描述。
论文目录
摘要Abstract1 绪论1.1 课题背景1.2 国内外发展现状1.3 课题的意义和主要研究内容1.3.1 课题的意义1.3.2 课题主要内容2 数据挖掘概述2.1 数据挖掘的的定义2.2 数据挖掘的过程2.2.1 数据挖掘环境2.2.2 数据挖掘过程2.3 数据挖掘的主要功能2.4 数据挖掘的应用现状2.5 本章小结3 关联规则研究3.1 关联规则3.1.1 关联规则的定义3.1.2 关联规则的分类3.1.3 关联规则的挖掘方法3.1.4 关联规则挖掘的基本步骤3.2 Apriori算法3.2.1 Apriori算法性质3.2.2 Apriori算法过程3.2.3 算法性能分析3.3 Qarmasm算法研究3.3.1 多值属性关联规则及其传统挖掘算法3.3.2 Qarmasm算法相关定义及性质3.3.3 Qarmasm算法思想及描述3.3.4 Qarmasm算法复杂性分析3.3.5 Qarmasm算法实现与分析3.3.6 结论3.4 EIUAQAR算法研究3.4.1 增量式关联规则分析及问题描述3.4.2 最小支持度发生变化时的关联规则增量式更新3.4.3 事务数据库发生变化时关联规则的增量式更新3.4.4 算例说明和算法分析3.4.5 结论3.5 本章小结4 规则提取系统的分析与设计4.1 系统分析4.1.1 系统设计目标4.1.2 系统需求分析4.2 系统设计4.2.1 系统逻辑结构图4.2.2 系统功能模块及其分析4.2.3 系统流程图4.2.4 数据库设计4.2.5 系统接口4.3 本章小结5 规则提取系统的实现5.1 功能模块实现5.1.1 数据载入5.1.2 数据预处理5.1.3 规则挖掘5.1.4 规则约简5.1.5 结果解释5.2 本章小结6 总结与展望致谢参考文献在校学习期间发表的论文
相关论文文献
标签:数据挖掘论文; 关联规则论文; 多值属性关联论文; 增量论文; 规则提取论文;