术语相似度和术语相关度的融合研究及应用

术语相似度和术语相关度的融合研究及应用

论文摘要

传统的信息检索方法采用基于关键词匹配的方式进行资源检索,这种检索方法不能实现语义概念上的匹配,也不能准确得到用户所需的信息。当利用给定文档集合中所包含的术语间的关系时,能够提高信息检索系统的性能,而术语相似度和术语相关度就是信息检索领域中挖掘术语间关系的主要方法。这两种方法只是单一的挖掘术语间的相似关系或相关关系,虽然在检索性能上可以获得一定程度的提高,但是不能满足用户日益增长的准确、全面定位信息的需求。如果融合这两种方法以量化术语间的关系,是否会得到更好的检索效果成为一个值得研究的问题。为此,本文探讨了如何利用术语间的关系来提高信息检索系统的性能,分析了术语相似度和术语相关度融合的可行性。利用基于《知网》的术语相似度计算方法和术语相关度中的非对称性共现分析法,设计出一种衡量术语间关系的融合算法,并将这种量化的术语关系应用于两种检索模型中。实验结果表明所提方法比单一使用术语相似度或术语相关度的方法具有更好的检索效果,能更有效地解决术语间语义概念的匹配问题。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 本文工作
  • 1.4 论文组织结构
  • 第2章 挖掘术语间关系的传统方法
  • 2.1 术语
  • 2.2 术语相似度的计算
  • 2.2.1 术语相似度
  • 2.2.2 基于语义词典的术语相似度计算
  • 2.2.3 基于大规模语料库的术语相似度计算
  • 2.3 术语相关度的计算
  • 2.3.1 术语相关度
  • 2.3.2 互信息方法
  • 2.3.3 共现频率法
  • 2.3.4 共现分析法
  • 第3章 信息检索与贝叶斯网络模型
  • 3.1 信息检索
  • 3.2 语义检索
  • 3.3 检索模型概述
  • 3.3.1 信息检索模型
  • 3.3.2 贝叶斯网络
  • 3.3.3 贝叶斯网络模型
  • 第4章 术语相似度和术语相关度的融合研究及应用
  • 4.1 基于《知网》的术语相似度计算
  • 4.2 基于非对称性共现分析的术语相关度计算
  • 4.3 术语相似度和术语相关度之间的联系
  • 4.4 融合算法
  • 4.5 在检索模型中的应用
  • 4.5.1 在信念网络检索模型中的应用
  • 4.5.2 在贝叶斯网络检索模型中的应用
  • 第5章 实验与分析
  • 5.1 准备工作
  • 5.1.1 术语抽取
  • 5.1.2 数据存储
  • 5.2 检索性能评价指标
  • 5.3 实验过程与分析
  • 第6章 总结与展望
  • 参考文献
  • 攻读硕士学位期间发表论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    术语相似度和术语相关度的融合研究及应用
    下载Doc文档

    猜你喜欢