构建面向知识服务的医学文献相关性数据库方法研究

构建面向知识服务的医学文献相关性数据库方法研究

论文摘要

为了进一步提高现有文献数据库的知识服务水平,中国医学科学院医学信息研究所近年来对构建面向知识服务的医学文献相关性数据库进行了大量的研究,已经探索出一套较为成熟且实用的基于词表分词的文献相关性判定算法,并基于此算法成功构建了中国生物医学工程文献相关性数据库。该数据库的文献相关性判定结果已具备较高的准确率,但在应用上受制于基础词表。因此,本论文在深入探讨基于词表分词算法的中国生物医学工程文献相关性数据库的基础上,采用不基于词表分词的后缀树算法,初步构建了医学文献相关性数据库,并将此方法与基于词表分词的构建方法进行了全方位的比较。本论文共分七个章节。第一章分别介绍了知识服务的内涵、特点,以及文献相关性数据库建设研究涉及的概念,并简单论述了二者之间的关系;第二章概述了文献相关性数据库的国内外研究进展,其中重点介绍了中国医学科学院医学信息研究所近年来有关文献相关性数据库的建设研究概况;第三章详细介绍了基于词表分词算法的医学文献相关性数据库的构建概况;第四章重点论述了基于后缀树算法的医学文献相关性数据库的建设过程;第五章通过数据测试、分析,评价了基于后缀树算法的医学文献相关性数据库的相关性判定效果;第六章比较了词表分词算法与后缀树算法在构建医学文献相关性数据库时的优缺点;第七章就面向知识服务的医学文献相关性数据库的进一步研究提出了几点建议。

论文目录

  • 目录
  • 图目录
  • 表目录
  • 摘要
  • Abstract
  • 1 前言
  • 1.1 知识服务
  • 1.1.1 知识服务的内涵
  • 1.1.2 知识服务与信息服务的区别
  • 1.1.3 知识服务在服务方式上的特点
  • 1.2 文献相关性数据库建设研究涉及的概念
  • 1.2.1 “相关性”
  • 1.2.2 相关文献
  • 1.2.3 文献相关性判定
  • 1.2.4 文献相关性数据库
  • 1.2.5 相关性检索
  • 1.3 文献相关性数据库建设与知识服务的关系
  • 2 文献相关性数据库建设研究进展
  • 2.1 文献相关性数据库国内外研究现状
  • 2.2 文献相关性数据库建设研究概况
  • 2.2.1 英文文献相关性判定算法的推导
  • 2.2.2 中文文献相关性判定算法的探讨
  • 2.2.3 文献相关性判定算法的优化
  • 2.2.4 生物医学工程词表的建设研究
  • 2.2.5 文献相关性判定算法的应用研究
  • 3 基于词表分词算法的医学文献相关性数据库的构建概况
  • 3.1 向量空间模型中相似度计算公式的推导
  • 3.2 试验数据的选取和准备
  • 3.3 文献自动分类
  • 3.4 文本自动分词与特征项抽取
  • 3.5 特征项归并
  • 3.6 特征项权重计算
  • 3.6.1 常用的特征项权重计算方法
  • 3.6.2 局域权重计算
  • 3.6.3 广域权重计算
  • 3.7 文献相似度计算与输出阈值的确定
  • 3.8 文献相关性判定结果的处理
  • 3.9 数据库实现效果的评价
  • 3.10 相关性检索系统的建立
  • 4 基于后缀树算法的医学文献相关性数据库建设研究
  • 4.1 后缀树
  • 4.1.1 后缀树概述
  • 4.1.2 后缀树的建树算法
  • 4.1.3 后缀树的匹配算法
  • 4.1.4 通用后缀树
  • 4.1.5 后缀树的删除算法
  • 4.2 建库的总体设想
  • 4.3 前期准备工作
  • 4.4 筛选相关文献候选集
  • 4.5 构建后缀树
  • 4.5.1 建树规则
  • 4.5.2 建树步骤
  • 4.6 文献的多元子串表示
  • 4.7 向量化
  • 4.8 权重计算
  • 4.9 相似度计算
  • 4.9.1 单个字段的相似度
  • 4.9.2 两篇文献总的相似度
  • 5 基于后缀树算法的医学文献相关性数据库结果分析
  • 5.1 评价指标
  • 5.1.1 相关准率
  • 5.1.2 相关构成比
  • 5.1.3 相关性判定时间
  • 5.2 评价方法
  • 5.2.1 确定样本含量
  • 5.2.2 随机抽样
  • 5.2.3 系统的相关性判定
  • 5.2.4 专家判定
  • 5.3 数据分析
  • 5.3.1 相关准率
  • 5.3.2 相关构成比
  • 5.3.3 相关性判定时间
  • 5.4 结论
  • 5.5 存在的不足
  • 6 两种相关性数据库构建方法的比较
  • 6.1 数据测试结果的比较
  • 6.1.1 三种评价指标的比较
  • 6.1.2 相关文献一致率的比较
  • 6.2 两种构建方法的共同点
  • 6.3 两种构建方法的不同点
  • 6.3.1 优点
  • 6.3.2 缺点
  • 7 建议
  • 7.1 进一步完善词表建设
  • 7.2 进一步改进基于后缀树的相关性判定算法
  • 7.3 探索其他的相关性判定方法
  • 参考文献
  • 附录
  • map的后缀树实现的部分代码'>附录1 基于hashmap的后缀树实现的部分代码
  • 附录2 随机抽样表
  • 附录3 相关准率专家判定表(数据库B)
  • 附录4 相关文献构成比(数据库B)
  • 附录5 一般相关构成比的K-S检验结果
  • 附录6 密切相关构成比的K-S检验结果
  • 附录7 相关准率专家判定表(数据库A)
  • 附录8 相关文献构成比(数据库A)
  • 附录9 数据库A与数据库B的比较结果
  • 附录10 相关文献一致率表
  • 附录11 相关文献一致率的K-S检验结果
  • 致谢
  • 相关论文文献

    • [1].了解10种侵入数据库方法 防患未然早做准备[J]. 计算机与网络 2019(09)
    • [2].数据库方法在阳明学研究中应用的构想[J]. 戏剧之家(上半月) 2014(04)
    • [3].静态页面访问数据库方法浅析[J]. 中国高新技术企业 2008(18)
    • [4].JDBC原理及操纵数据库方法[J]. 科技信息 2009(02)
    • [5].VC++通过ADO访问数据库方法择优[J]. 数字技术与应用 2012(04)
    • [6].基于JDBC的通用的访问数据库方法[J]. 电脑知识与技术 2008(34)
    • [7].中国近代寺庙登记表数据库及量化研究[J]. 道教学刊 2018(01)
    • [8].JSP技术访问数据库方法的研究[J]. 中国科技信息 2009(19)
    • [9].优化查询WEB数据库方法及其实现[J]. 科技视界 2014(18)
    • [10].日志文件恢复数据库方法两则[J]. 计算机与网络 2013(09)
    • [11].中国近代宗教社会史的量化研究——以构建寺庙登记表数据库为中心的讨论[J]. 社会科学研究 2018(01)
    • [12].清以降云南山地小流域人口Access数据库的设计——以峨山县槽子河流域聚落人口为例[J]. 文山学院学报 2018(02)
    • [13].ASP连接数据库方法探索[J]. 电脑知识与技术 2008(25)
    • [14].关于建立宅基地与房屋一体化登记数据库方法的探讨[J]. 智能城市 2018(19)
    • [15].Dreamweaver制作asp网页自定义字符串连接sqlserver 2005数据库方法探究[J]. 科技风 2017(05)
    • [16].ASP环境下访问WEB数据库方法的探讨[J]. 山西电子技术 2013(05)
    • [17].基于eN-数据库方法复杂构型飞机转捩预测[J]. 航空计算技术 2016(05)
    • [18].Authorware连接数据库方法的研究[J]. 电脑与信息技术 2008(02)
    • [19].Delphi通过ADO技术访问数据库方法研究[J]. 电子设计工程 2013(10)
    • [20].PBL结合数据库在超声教学中的应用研究[J]. 中国继续医学教育 2019(13)
    • [21].基于指令系统的Excel数据导入数据库方法研究[J]. 微电子学与计算机 2014(09)
    • [22].寒地杂粮实验教学示范中心排课管理系统开发研究[J]. 无线互联科技 2020(09)
    • [23].通用菜单自动生成数据库方法分析[J]. 煤炭技术 2011(07)
    • [24].建立MALDI-TOFMS鉴定的海洋致病性弧菌数据库样本前处理的适宜条件[J]. 中华临床实验室管理电子杂志 2018(01)
    • [25].动态网站连接数据库方法应用于LabVIEW的研究[J]. 化工自动化及仪表 2010(08)
    • [26].北京市基本比例尺地形图一体化数据库建设与应用[J]. 北京测绘 2018(03)
    • [27].浅析从Sybase移植到GBase 8a国产数据库方法[J]. 科技展望 2016(22)
    • [28].基于Visual Basic访问Oracle数据库方法的改进[J]. 计算机时代 2011(05)
    • [29].一种基于主题的无中心节点订阅发布系统设计[J]. 自动化技术与应用 2020(07)
    • [30].基于函数局部扫描解决海量数据库读取[J]. 电脑与信息技术 2016(02)

    标签:;  ;  ;  ;  

    构建面向知识服务的医学文献相关性数据库方法研究
    下载Doc文档

    猜你喜欢