论文摘要
传统的信息检索方法采用基于关键词匹配的方式进行资源检索,这种检索方法不能实现语义概念上的匹配,也不能准确得到用户所需的信息。当利用给定文档集合中所包含的术语间的关系时,能够提高信息检索系统的性能,而术语相似度和术语相关度就是信息检索领域中挖掘术语间关系的主要方法。这两种方法只是单一的挖掘术语间的相似关系或相关关系,虽然在检索性能上可以获得一定程度的提高,但是不能满足用户日益增长的准确、全面定位信息的需求。如果融合这两种方法以量化术语间的关系,是否会得到更好的检索效果成为一个值得研究的问题。为此,本文探讨了如何利用术语间的关系来提高信息检索系统的性能,分析了术语相似度和术语相关度融合的可行性。利用基于《知网》的术语相似度计算方法和术语相关度中的非对称性共现分析法,设计出一种衡量术语间关系的融合算法,并将这种量化的术语关系应用于两种检索模型中。实验结果表明所提方法比单一使用术语相似度或术语相关度的方法具有更好的检索效果,能更有效地解决术语间语义概念的匹配问题。
论文目录
摘要Abstract第1章 引言1.1 研究背景1.2 国内外研究现状1.3 本文工作1.4 论文组织结构第2章 挖掘术语间关系的传统方法2.1 术语2.2 术语相似度的计算2.2.1 术语相似度2.2.2 基于语义词典的术语相似度计算2.2.3 基于大规模语料库的术语相似度计算2.3 术语相关度的计算2.3.1 术语相关度2.3.2 互信息方法2.3.3 共现频率法2.3.4 共现分析法第3章 信息检索与贝叶斯网络模型3.1 信息检索3.2 语义检索3.3 检索模型概述3.3.1 信息检索模型3.3.2 贝叶斯网络3.3.3 贝叶斯网络模型第4章 术语相似度和术语相关度的融合研究及应用4.1 基于《知网》的术语相似度计算4.2 基于非对称性共现分析的术语相关度计算4.3 术语相似度和术语相关度之间的联系4.4 融合算法4.5 在检索模型中的应用4.5.1 在信念网络检索模型中的应用4.5.2 在贝叶斯网络检索模型中的应用第5章 实验与分析5.1 准备工作5.1.1 术语抽取5.1.2 数据存储5.2 检索性能评价指标5.3 实验过程与分析第6章 总结与展望参考文献攻读硕士学位期间发表论文情况致谢
相关论文文献
标签:术语相似度论文; 术语相关度论文; 融合论文; 贝叶斯网络论文;