一种非结构化数据中医知识抽取与关联的方法

一种非结构化数据中医知识抽取与关联的方法

论文摘要

随着计算机技术和Internet的飞速发展,数字图书馆以其便捷性和易访问性,正日益取代传统图书馆作为知识传播中心的地位,成为新兴的数据和知识中心。然而数字图书馆的海量数字化资源大多是非结构化的,其文本信息都很难被各种应用程序识别和直接利用,更不用说蕴含在文本中的知识了。因此,基于文本处理的知识抽取和挖掘技术已经成为数字图书馆领域的一个研究热点,并且出现了许多基于不同原理的技术和方法。本文主要研究了非结构化的中医药书籍文本的知识抽取和关联技术,并以此实现了一个中医药信息服务系统。该系统完成了中医药书籍文本的知识抽取和关联工作,同时利用抽取和整合的信息辅助读者查阅数字图书馆中的中医药文献。知识抽取是利用支持向量机的方法完成的。首先设计中医药知识的概念体;其次为概念体的每个内容设置一个支持向量机;然后根据中医药文本的排版布局特征、用词特征以及内容特征等设置各个支持向量机的特征向量;最后通过组合各单个概念体内容的抽取模式得到整个概念的抽取模式。此方法有效地解决了从非结构化文本中抽取结构化信息的难题。知识关联着重于中医药知识点之间的关系挖掘,利用目录文件中的分类层次结构挖掘中医药知识点之间的直接联系;利用字符串匹配或文本相似度比较挖掘中医药知识点之间的间接联系;利用聚类的方法挖掘方剂间的潜在联系。本文的所提的知识抽取和关联技术,将中医知识从非结构化的文本中抽取出来,以特定的结构存储、组织,并对各知识点进行有效的关联,并在此基础上实现了一个中医药信息服务系统,为读者提供多元化的信息服务。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究现状
  • 1.3 主要研究内容
  • 1.4 文章结构
  • 第2章 相关技术背景综述
  • 2.1 知识抽取
  • 2.1.1 知识抽取定义
  • 2.1.2 知识抽取与相关概念之间的关系
  • 2.1.3 知识抽取过程
  • 2.1.4 知识抽取应用领域
  • 2.1.5 文本信息抽取
  • 2.2 模式学习
  • 2.3 支持向量机(SVM)
  • 2.3.1 SVM的提出
  • 2.3.2 SVM分类原理
  • 2.3.3 SVM性能分析
  • 2.4 知识关联的常用方法
  • 2.5 聚类的方法
  • 2.6 AP聚类算法简介
  • 2.7 本章小结
  • 第3章 非结构化中医文本的知识抽取
  • 3.1 系统设计
  • 3.1.1 知识概念体设计
  • 3.1.2 知识抽取流程设计
  • 3.2 基于SVM的信息抽取模式学习
  • 3.2.1 文本特征选择
  • 3.2.2 文本特征量化
  • 3.2.3 方剂抽取模式学习
  • 3.3 效果评价
  • 3.4 本章小结
  • 第4章 中医药知识关系挖掘
  • 4.1 中医药直接知识关系挖掘
  • 4.2 中医药间接知识关系挖掘
  • 4.2.1 显式间接关联
  • 4.2.2 隐式间接关联
  • 4.2.3 文本相似度计算
  • 4.3 中医药潜在知识关系挖掘
  • 4.3.1 方剂属性特征量化
  • 4.3.2 方剂聚类参数计算
  • 4.3.3 方剂聚类结果
  • 4.4 本章小结
  • 第5章 系统实现与展示
  • 5.1 中医药信息服务系统功能拓扑图
  • 5.2 知识概念展示
  • 5.3 知识关联展示
  • 5.3.1 分类索引
  • 5.3.2 关联查询
  • 5.3.3 推荐
  • 5.4 特色功能展示
  • 5.4.1 方剂组成展示
  • 5.4.2 古籍现代文对比阅读
  • 5.5 本章小结
  • 第6章 总结与展望
  • 6.1 本文总结
  • 6.2 未来工作展望
  • 参考文献
  • 攻读硕士学位期间主要的研究成果
  • 致谢
  • 相关论文文献

    • [1].安全问题不是大数据发展拦路虎[J]. 网络安全和信息化 2016(07)
    • [2].基于深度学习模型的非结构化数据标注方法研究[J]. 西北民族大学学报(自然科学版) 2020(02)
    • [3].面向大数据的音乐艺术院校非结构化资源的管理与应用[J]. 科教文汇(上旬刊) 2020(08)
    • [4].大数据时代下的数据仓库新升级[J]. 金融电子化 2017(07)
    • [5].分析非结构化数据的10个要点[J]. 电脑知识与技术(经验技巧) 2017(12)
    • [6].铁路货运非结构化数据的应用与应用框架研究[J]. 交通运输工程与信息学报 2017(01)
    • [7].企业非结构化数据元数据模型设计[J]. 云南电力技术 2016(S2)
    • [8].浅析非结构化电子文件[J]. 兰台世界 2016(16)
    • [9].基于素质教育的地理非结构化教学研究[J]. 中学教学参考 2020(10)
    • [10].运用非结构化材料 创造无限教育价值[J]. 基础教育研究 2017(18)
    • [11].“大数据”的温情[J]. 中小学信息技术教育 2017(05)
    • [12].基于蚁群算法的非结构化大数据深度挖掘仿真[J]. 计算机仿真 2020(11)
    • [13].面向中文科技文献非结构化摘要的知识元表示与抽取研究——基于知识元本体理论[J]. 情报理论与实践 2020(02)
    • [14].基于关键词检索的非结构化数据审计应用研究[J]. 中国内部审计 2020(04)
    • [15].非结构化道路识别研究综述[J]. 科技资讯 2019(02)
    • [16].大型企业非结构化数据管理平台设计[J]. 中国科技信息 2019(07)
    • [17].非结构化机器数据范式化处理的研究[J]. 现代信息科技 2018(06)
    • [18].非结构化数据安全需关注[J]. 网络安全和信息化 2016(02)
    • [19].非结构化电子病历关系抽取的机器学习[J]. 中国数字医学 2017(06)
    • [20].面向云存储的非结构化数据存储研究[J]. 计算机光盘软件与应用 2014(19)
    • [21].开放教育对学生流动非结构化管理的策略研究[J]. 当代教育实践与教学研究 2015(09)
    • [22].非结构化材料在大班表现性活动区中的有效运用[J]. 新课程(综合版) 2018(05)
    • [23].非结构化数据存储管理研究[J]. 科研信息化技术与应用 2013(01)
    • [24].一种非结构化数据的多牵度分配存取实现方法[J]. 科技通报 2014(08)
    • [25].基于主体行为的非结构化数据模型[J]. 计算机工程与设计 2013(03)
    • [26].基于词语语义和隐喻逻辑的顾客非结构化需求分析[J]. 中国机械工程 2013(08)
    • [27].世博会旅游形象的结构化与非结构化测量——以重庆市民对世博会感知为例[J]. 安徽农业科学 2009(27)
    • [28].集成非结构化数据[J]. 软件世界 2008(01)
    • [29].基于公共模型技术的非结构化数据模型设计与应用研究[J]. 电子设计工程 2018(05)
    • [30].从容应对金融海量非结构化数据存储[J]. 金融电子化 2018(04)

    标签:;  ;  ;  ;  ;  

    一种非结构化数据中医知识抽取与关联的方法
    下载Doc文档

    猜你喜欢