中医药数据挖掘系统TCMiner设计、实现与核心技术研究

中医药数据挖掘系统TCMiner设计、实现与核心技术研究

论文摘要

中华医药有着3000多年的积淀和长期的医疗诊病历史,是中国文化的重要组成部分。然而,由于中药方剂为具体医疗经验的人工汇总,且为历史的继承,虽然有广博精深的中医理论作为支持,但传统中医理论为诊病方剂的人为总结和提炼,其整体性、辩证性、动态性等本质特征过于抽象和定性化,难于定量和具体的把握。数据挖掘旨在借助计算机强大的存储和计算能力,通过对分析需求的确切定义和高效的算法设计实现大规模数据库中有效的知识发现,为中医处方的研究提供了新的途径。四川大学计算机学院和成都中医药大学自2003年起合作进行了3年中医药数据挖掘的研究并合作开发了中医药数据挖掘系统TCMiner 1.0。 本文的主要贡献包括: (1) TCMiner原型设计。设计中医药数据挖掘原型系统TCMiner并实现其第1版本TCMiner 1.0。首先,介绍中药数据分析方法学与技术路线,其次,分析中医药方剂多维数据分析的核心需求,再次,讲述TCMiner系统中各方面的设计问题,然后,勾勒最终TCMiner需实现的系统功能和应当采取的体系结构,最后,描述高效算法的实现。 (2) TCMiner核心技术研究。提出TCMiner 1.0的核心技术:(a)基于基因表达式编程的数据挖掘,(b)基于关联规则的配伍分析,(c)基于多维频繁模式挖掘的主成分分析。 (3) 基于基因表达式编程的数据挖掘—提出基于Scale的GEP。Scale支持一次创建多次使用,解决了动态生成释放ET带来的时间开销,基于Scale

论文目录

  • 中文摘要
  • 英文摘要
  • 第1章 绪论
  • 1.1 研究背景
  • 1.1.1 中华医药简介
  • 1.1.2 数据挖掘简介
  • 1.1.2.1 数据挖掘的目标
  • 1.1.2.2 数据挖掘的概念
  • 1.1.2.3 数据挖掘的功能
  • 1.1.2.4 数据挖掘的分类
  • 1.1.3 中医药数据挖掘的产生
  • 1.1.3.1 进行中医药数据挖掘的必要性
  • 1.1.3.2 中医药数据挖掘的可能性
  • 1.2 研究现状
  • 1.2.1 北京中医药大学的工作
  • 1.2.2 浙江大学的工作
  • 1.3 本文的主要工作
  • 1.4 论文结构
  • 第2章 中医药数据挖掘系统 TCMiner的原型设计
  • 2.1 引言
  • 2.2 中医药数据分析方法学
  • 2.2.1 中医药方剂一瞥
  • 2.2.2 技术路线
  • 2.3 TCMiner的核心需求和核心技术
  • 2.4 设计问题
  • 2.4.1 数据标准化和规范化
  • 2.4.2 处理离散值数据
  • 2.4.3 高性能算法的设计
  • 2.4.4 灵活性和互操作性考虑
  • 2.5 系统功能
  • 2.5.1 处理流
  • 2.5.2 主要模块
  • 2.6 实现算法的性能展示
  • 2.6.1 频繁模式挖掘算法
  • 2.6.2 关联规则产生算法
  • 2.6.3 频繁闭模式和规则挖掘算法
  • 2.7 小结
  • 第3章 基因的无树评估
  • 3.1 引言
  • 3.2 预备知识
  • 3.2.1 基因表达式编程关键技术─基因型中变异,表现型中评估
  • 3.2.2 基于 ET表达和评估基因
  • 3.3 基于 Scale进行基因的表达和评估
  • 3.3.1 基于 ET进行基因表达和评估的代价
  • 3.3.2 将基因表达至 Scale
  • 3.3.3 基于 Scale的基因评估
  • 3.3.4 带变量矩阵的基于 Scale的基因评估
  • 3.4 性能研究
  • 3.4.1 基于Scale的基因表达vs.基于 ET的基因表达
  • 3.4.2 基于 Scale的基因评估vs.基于 ET的基因评估
  • 3.5 小结
  • 3.6 附录传统 GEP算法时间消耗分析
  • 第4章 高效的最近邻优先算法 NNF
  • 4.1 中药方剂的配伍分析
  • 4.1.1 配伍分析
  • 4.1.2 药组药对配伍
  • 4.1.3 “君臣佐使”配伍
  • 4.1.4 总体思路
  • 4.2 分析中药方剂配伍的最近邻优先算法 NNF
  • 4.3 基本概念
  • 4.4 索引频繁模式树 IFPT
  • 4.4.1 频繁模式树
  • 4.4.2 利用 FPT产生关联规则的算法 Traverse
  • 4.4.3 索引频繁模式树
  • 4.5 Nearest Neighbour First(NNF)算法
  • 4.5.1 优化策略
  • 4.5.2 最近邻优先算法 NNF
  • 4.6 性能研究
  • 4.6.1 Traverse算法vs.Linear算法
  • 4.6.2 NNF算法vs.Traverse算法
  • 4.6.3 NNF算法vs.Apriori算法
  • 4.7 NNF算法在中医药数据分析中的应用
  • 4.7.1 药组药对发现
  • 4.7.2 研究“君臣佐使”配伍
  • 4.8 小结
  • 第5章 中药方剂的多维主药分析
  • 5.1 引言
  • 5.2 本研究的动机
  • 5.3 多维频繁模式的形式化定义
  • 5.4 剪枝策略
  • 5.5 多维索引树 MDIT的设计、创建和空间复杂性分析
  • 5.5.1 反索引技术
  • 5.5.2 多维索引树(MDIT)
  • 5.5.3 MDIT的创建算法
  • 5.5.4 MDIT的空间复杂度分析
  • 5.6 算法 MDIT-Mining
  • 5.6.1 多维频繁模式挖掘算法
  • 5.6.2 在指定维度集合上进行挖掘
  • 5.6.3 增量更新
  • 5.7 性能研究
  • 5.7.1 测试数据集
  • 5.7.2 算法 Build-MDIT和算法 MDIT-Mining的时间可伸缩性对比
  • 5.7.3 MDIT的空间可伸缩性
  • 5.7.4 真实数据集上的实验
  • 5.7.5 系统实现
  • 5.8 小结
  • 第6章 TCMiner 1.0系统实现
  • 6.1 TCMiner 1.0简介
  • 6.1.1 方剂数据库的结构
  • 6.1.2 TCMiner 1.0的主要模块和功能
  • 6.2 药组药对子系统
  • 6.2.1 功能简介
  • 6.2.2 主要步骤
  • 6.2.3 核心处理流程
  • 6.2.4 简要界面
  • 6.3 类方主药子系统
  • 6.3.1 功能简介
  • 6.3.2 主要步骤
  • 6.3.3 核心处理流程
  • 6.3.4 简要界面
  • 第7章 结论
  • 7.1 本文的主要创新点
  • 7.2 未来的研究方向
  • 参考文献
  • 攻读学位期间的研究成果
  • 1. 科研项目
  • 2. 论文
  • 3. 译著
  • 4. 奖励情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

    中医药数据挖掘系统TCMiner设计、实现与核心技术研究
    下载Doc文档

    猜你喜欢