基于本体的语义检索技术研究

基于本体的语义检索技术研究

论文摘要

信息检索(Information Retrieval, IR),是从数据集中提取相关文档和信息的过程。随着数字信息量的不断增加以及用户对查询质量的要求的提高,传统的信息检索技术已经很难满足高质量的检索任务。本体作为一种论点新颖、起点较高的知识组织体系,它所涉及的相关技术对于促进信息检索技术在知识管理中发挥作用十分重要。针对目前大多数信息检索系统都是基于语法层上机械式的关键词匹配检索技术,缺乏语义处理能力,存在信息的误检、漏检等缺陷,作者在研究了信息检索技术的相关理论和本体技术的相关知识后,通过分析传统向量空间模型在语义处理方面的缺陷,本文构建了一个基于模糊本体的信息检索系统结构模型,借助于模糊本体,探讨了在检索过程中如何利用本体的领域知识实现基于概念的查询。该模型充分利用了模糊本体中隶属度的概念,对查询语句和文档关键词向量空间模型进行模糊本体概念映射,概念相似度计算。系统模型分为文档预处理和文档检索两大部分。与传统的信息检索系统结构不同的是,该模型中加入了本体服务器。在本体的帮助下,文档预处理对检索对象进行处理,建立基于概念的索引;文档检索部分的查询转换模块对用户需求进行部分的语义化处理,利用查询表达式中包含概念的上位词、下位词、同义词以及概念的义项对初始查询表达式进行了查询转换,检索代理模块利用转换后的查询表达式到信息源中进行查询。在具体的实现过程中,作者针对检索过程中的关键部分—查询扩展进行了深入的研究,并对扩展结果使用A priori算法进行修剪。文章最后利用本文研究成果实现了一个面向计算机取证领域的信息检索系统,并通过具体数值实验对该系统在查全率和查准率方面进行了性能分析,实验证明该系统具有良好的性能。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 课题研究目的和意义
  • 1.2 课题国内外研究现状
  • 1.3 课题的主要研究内容
  • 1.4 论文创新点
  • 1.5 文章组织结构
  • 第2章 信息检索技术
  • 2.1 信息检索模型的概念
  • 2.2 信息资源和需求表示
  • 2.3 信息检索过程
  • 2.3.1 信息检索的数学模型
  • 2.3.2 特征内容处理
  • 2.4 信息检索结果分析
  • 2.4.1 影响检索结果排序的因素
  • 2.4.2 检索系统评价
  • 2.5 当前信息检索的不足
  • 2.6 小结
  • 第3章 本体论研究
  • 3.1 本体的概念
  • 3.2 本体的分类
  • 3.3 本体的功能
  • 3.4 本体的建模元语
  • 3.5 本体的描述语言
  • 3.5.1 RDF
  • 3.5.2 RDFS
  • 3.5.3 OWL
  • 3.6 构建本体的规则
  • 3.7 本体构建工具
  • 3.8 本体建模方法
  • 3.9 本体在信息检索中的应用
  • 3.10 小结
  • 第4章 基于领域本体的信息检索系统研究
  • 4.1 语义信息检索系统的概念和特点
  • 4.2 语义信息检索系统的设计目标
  • 4.3 语义信息检索系统的基本思路
  • 4.4 传统的向量空间模型
  • 4.4.1 基本概念
  • 4.4.2 特征项的选择
  • 4.4.3 分词
  • 4.5 一种基于模糊本体的向量空间模型
  • 4.6 基于领域本体的文档处理
  • 4.7 基于领域本体的文档检索
  • 4.8 小结
  • 第5章 基于模糊本体的语义检索系统实现
  • 5.1 系统结构
  • 5.2 系统开发工具
  • 5.3 文档预处理模块
  • 5.3.1 PDF、Word、Excel 纯文本提取
  • 5.3.2 分词
  • 5.4 知识库构建模块
  • 5.5 查询语义扩展模块
  • 5.6 语义检索模块
  • 5.7 检索结果优化模块
  • 5.8 系统演示界面
  • 5.9 数值试验
  • 第6章 总结与展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间取得的科研成果
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于本体的语义检索技术研究
    下载Doc文档

    猜你喜欢