中医药知识发现可靠性研究

中医药知识发现可靠性研究

论文摘要

知识发现可靠性是知识发现领域中一个重要但容易忽视的主题。随着知识发现和数据挖掘技术的广泛应用,有一个问题逐渐引起人们的关注,即在什么条件下知识发现是可靠的,或者说在什么条件下所发现的知识是可靠的。近年来在知识发现可靠性方面的研究,大多关注于某一具体数据挖掘模型下的可靠性问题。而对于不同模型间存在的可靠性共同主题,比如数据质量、评估方法等等,迄今为止仍没有一项系统性研究。针对知识发现可靠性的共同主题,进行分阶段、系统化的总结和梳理,已成为知识发现可靠性研究的一大迫切需要。在知识发现技术所应用的各个领域,有一个领域特别需要知识发现可靠性的研究,即中医药领域。作为中华民族重要文化财富和学术成就的中医药,近年来面临着生存和发展的挑战。如何把这一挑战化为中医药发展的契机,利用知识发现技术促进中医药的跨越式发展,已成为中医药研究人员的一项重要课题。近年来的中医药信息化工作已为知识发现创造了有利条件。然而,由于中医药数据自然语言性强,数据表达涵义丰富,表达方式多样化,而且在数据质量上还面临较大问题,在具备这些特征的数据上所进行的知识发现,相比其他领域来讲,就更加需要关注和研究知识发现可靠性问题。在这一背景下,本文围绕中医药知识发现可靠性这一主题,从知识发现整个生命周期的各个阶段对可靠性因素进行探讨,提出了知识发现可靠性框架PBRF-KD。针对中医药知识发现中比较突出的可靠性问题,重点探讨中医药知识发现中的结构性因素、表达性因素和信任性因素三大问题。本文的研究工作与贡献包括如下几个方面:1)提出了基于过程的知识发现可靠性框架针对现有知识发现可靠性研究模型相关的特点,提出了一个与模型/应用无关的知识发现可靠性框架PBRF-KD,该框架采用基于过程的思路对知识发现整个流程中的各个阶段和可靠性因素进行了梳理,归纳出了7种可靠性相关因素。该框架为知识发现项目设立了整套与可靠性相关的蓝本。2)提出了结构相关的可靠性因素的优化方法分析了中医药知识发现中与结构相关的可靠性因素,主要指数据完整性。针对文本型字段的完整性问题,提出了基于顺序半相关度量的中医药文本缺失字段填补方法。针对中医药文献类别标签缺失的问题,提出了基于M-Similarity的多标签文本分类方法。3)提出了表达相关的可靠性因素的优化方法分析了中医药知识发现中与表达相关的可靠性因素,包括表达粒度和表达一致性。针对表达粒度,提出了基于规则的表达粒度细分方法。针对表达一致性,提出了基于本体的表达一致化方法。该套方法有助于提高中医药与表达相关的可靠性。4)提出了信任相关的可靠性因素的优化方法分析了中医药知识发现中与信任相关的可靠性因素,主要指数据可信度。针对中医药特有的数据可信度问题,提出了基于历史文献认可度的数据可信度衡量方法,和基于互联网知名度的数据可信度衡量方法。此外,基于这两种可信度衡量方法,提出了基于数据可信度的加权频繁模式挖掘算法,并在消渴方和脾胃方数据集上获得了有意义的结果。该套方法有助于提高中医药与信任相关的可靠性。

论文目录

  • 致谢
  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 知识发现研究背景
  • 1.2 中医药知识发现研究背景
  • 1.2.1 中医药的跨越式发展需要信息技术
  • 1.2.2 中医药积累的海量数据需要知识发现
  • 1.2.3 中医药信息化成果为知识发现创造了条件
  • 1.2.4 中医药特点迫切需要知识发现可靠性研究
  • 1.3 本文的研究内容与主要贡献
  • 1.4 本文的组织结构
  • 第2章 中医药知识发现研究现状
  • 2.1 中医药知识发现数据基础
  • 2.1.1 中国方剂数据库
  • 2.1.2 中国中药数据库
  • 2.1.3 中国中医药期刊文献数据库
  • 2.1.4 中医药学语言系统
  • 2.2 中医药知识发现现状
  • 2.2.1 中医方剂知识发现
  • 2.2.2 中药知识发现
  • 2.2.2.1 中药药性知识发现
  • 2.2.2.2 中药化学成分知识发现
  • 2.2.3 中医证候知识发现
  • 2.3 中医药知识发现发展趋势
  • 第3章 知识发现可靠性框架PBRF-KD
  • 3.1 知识发现可靠性的过程视角
  • 3.2 PBRF-KD知识发现可靠性框架
  • 3.2.1 一般知识发现过程中的可靠性框架
  • 3.2.2 基于CRISP-DM的可靠性框架PBRF-KD
  • 3.2.3 PBRF-KD框架中的7种可靠性相关因素
  • 3.2.3.1 目标
  • 3.2.3.2 领域
  • 3.2.3.3 数据质量
  • 3.2.3.4 数据预处理
  • 3.2.3.5 模型选择
  • 3.2.3.6 评估方法
  • 3.2.3.7 部署机制
  • 3.2.3.8 PBRF-KD小结
  • 3.3 PBRF-KD在中医药领域的应用
  • 3.3.1 中医药知识发现中的目标
  • 3.3.2 中医药知识发现中的领域
  • 3.3.3 中医药知识发现中的数据质量
  • 3.3.4 中医药知识发现中的数据预处理
  • 3.3.5 中医药知识发现中的模型选择
  • 3.3.6 中医药知识发现中的评估方法
  • 3.3.7 中医药知识发现中的部署机制
  • 3.4 本章小结
  • 第4章 结构性因素的分析与优化
  • 4.1 中医药知识发现中的结构性因素
  • 4.1.1 数据完整性分析-属性的缺失
  • 4.1.2 数据完整性分析-属性值的缺失
  • 4.2 结构性因素优化方法
  • 4.2.1 基于顺序半相关度量的文本缺失字段填补方法
  • 4.2.1.1 基于顺序的文本相似度分类体系
  • 4.2.1.2 顺序半相关的文本相似度度量
  • 4.2.1.3 基于M-Similarity的最近邻匹配填补方法
  • 4.2.1.4 文本字段填补实验结果分析和评估
  • 4.2.2 基于M-Similarity的多标签文本分类方法
  • 4.2.2.1 多标签文本分类的现状与不足
  • 4.2.2.2 基于M-Similarity的多标签文本分类方法
  • 4.2.2.3 多标签文本分类实验结果分析与评估
  • 4.3 本章小结
  • 第5章 表达性因素的分析与优化
  • 5.1 中医药知识发现中的表达性因素
  • 5.1.1 表达粒度分析
  • 5.1.1.1 表达粒度过小
  • 5.1.1.2 表达粒度过大
  • 5.1.2 表达一致性分析
  • 5.1.2.1 数值单位不一致
  • 5.1.2.2 一义多词
  • 5.2 表达性因素优化方法
  • 5.2.1 基于规则的表达粒度细分方法
  • 5.2.1.1 预处理规则
  • 5.2.1.2 拆分规则
  • 5.2.2 基于本体的表达一致化方法
  • 5.3 本章小结
  • 第6章 信任性因素的分析与优化
  • 6.1 中医药知识发现中的信任性因素
  • 6.2 中医药知识发现中的数据可信度衡量方法
  • 6.2.1 基于互联网知名度的数据可信度衡量方法
  • 6.2.2 基于历史文献认可度的数据可信度衡量方法
  • 6.3 基于数据可信度的加权频繁模式挖掘算法
  • 6.3.1 加权频繁模式挖掘算法
  • 6.3.2 基于互联网知名度的加权频繁模式挖掘
  • 6.3.2.1 消渴方实验结果
  • 6.3.2.2 脾胃方实验结果
  • 6.3.3 基于历史文献认可度的加权频繁模式挖掘
  • 6.3.3.1 消渴方实验结果
  • 6.3.3.2 脾胃方实验结果
  • 6.4 本章小结
  • 第7章 中医药知识发现系统DartSpora
  • 7.1 知识发现系统发展历史
  • 7.1.1 基于单机体系结构的知识发现系统
  • 7.1.2 基于并行体系结构的知识发现系统
  • 7.1.3 基于分布式体系结构的知识发现系统
  • 7.1.4 基于网格体系结构的知识发现系统
  • 7.1.4.1 Discovery Net
  • 7.1.4.2 Knowledge Grid
  • 7.1.4.3 DataMiningGrid
  • 7.1.5 知识发现系统发展小结
  • 7.2 中医药知识发现原型系统DartSpora
  • 7.2.1 DartSpora系统架构
  • 7.2.2 DartSpora虚拟组织模型
  • 7.2.3 DartSpora系统功能
  • 7.2.4 DartSpora对知识发现可靠性的关注
  • 7.3 本章小结
  • 第8章 总结与展望
  • 8.1 本文工作总结
  • 8.2 未来工作展望
  • 参考文献
  • 作者简历
  • 攻读博士学位期间的科研成果
  • 相关论文文献

    • [1].论中医药知识产权保护的特殊性[J]. 法制博览 2020(13)
    • [2].如何保护防疫中医药知识产权[J]. 中国外资 2020(19)
    • [3].我国中医药知识产权保护的问题与对策[J]. 中华中医药杂志 2019(11)
    • [4].中医药知识工程的理论体系构建和关键技术分析[J]. 知识管理论坛 2016(05)
    • [5].我国中医药知识产权保护问题及其对策[J]. 中国经贸导刊 2015(18)
    • [6].我国中医药知识产权保护的研究[J]. 科技视界 2015(28)
    • [7].中医药知识进校园[J]. 教育 2017(48)
    • [8].采用“三因制宜”模式推进中医药知识技术进校园[J]. 卫生职业教育 2020(20)
    • [9].中医药知识图谱构建与应用[J]. 医学信息学杂志 2016(04)
    • [10].中山火炬开发区社区居民中医药知识认知及应用状况调查分析[J]. 北方药学 2016(08)
    • [11].中医药知识图谱构建[J]. 医学信息学杂志 2015(08)
    • [12].对中医药知识产权保护的思考[J]. 前进论坛 2014(05)
    • [13].江苏省中医药知识宣传普及工作的实践与思考[J]. 中医药管理杂志 2012(01)
    • [14].成都地区中医药知识产权保护现状及分析[J]. 成都中医药大学学报 2012(02)
    • [15].山西将通过11项措施保护利用中医药知识产权[J]. 中医药导报 2011(04)
    • [16].史贻云委员:中医药知识进中小学教材[J]. 光明中医 2010(05)
    • [17].我国中医药知识产权保护的现状及意义[J]. 中国中医基础医学杂志 2010(10)
    • [18].基层医务人员中医药知识技能培训需求调研分析[J]. 中医药管理杂志 2009(01)
    • [19].中医药知识产权保护现状及对策[J]. 亚太传统医药 2009(01)
    • [20].论我国中医药知识产权保护对策[J]. 吉林中医药 2009(04)
    • [21].我国与中医药知识产权有关的法律建设及成就回顾[J]. 上海中医药大学学报 2008(01)
    • [22].中医药知识产权的法律保护[J]. 医药导报 2008(05)
    • [23].云南基层中医药知识普及宣传途径分析[J]. 河北企业 2016(10)
    • [24].湖北中医药知识产权保护现状及对策[J]. 当代经济 2013(04)
    • [25].两会代表委员呼吁:实施国家中医药知识产权保护战略[J]. 中医药管理杂志 2010(03)
    • [26].我国中医药知识产权保护现状分析及对策[J]. 法制与社会 2010(15)
    • [27].史贻云委员:中医药知识应进中小学教材[J]. 中国中医药现代远程教育 2010(08)
    • [28].中医药知识产权保护的对策刍议[J]. 中国药房 2010(31)
    • [29].中医药知识产权保护的现状、问题及对策探讨[J]. 法制与经济(中旬刊) 2010(10)
    • [30].中医药知识走进小学课堂的思考[J]. 中医教育 2018(06)

    标签:;  ;  ;  ;  ;  ;  

    中医药知识发现可靠性研究
    下载Doc文档

    猜你喜欢