论文摘要
信息检索(Information Retrieval, IR),是从数据集中提取相关文档和信息的过程。随着数字信息量的不断增加以及用户对查询质量的要求的提高,传统的信息检索技术已经很难满足高质量的检索任务。本体作为一种论点新颖、起点较高的知识组织体系,它所涉及的相关技术对于促进信息检索技术在知识管理中发挥作用十分重要。针对目前大多数信息检索系统都是基于语法层上机械式的关键词匹配检索技术,缺乏语义处理能力,存在信息的误检、漏检等缺陷,作者在研究了信息检索技术的相关理论和本体技术的相关知识后,通过分析传统向量空间模型在语义处理方面的缺陷,本文构建了一个基于模糊本体的信息检索系统结构模型,借助于模糊本体,探讨了在检索过程中如何利用本体的领域知识实现基于概念的查询。该模型充分利用了模糊本体中隶属度的概念,对查询语句和文档关键词向量空间模型进行模糊本体概念映射,概念相似度计算。系统模型分为文档预处理和文档检索两大部分。与传统的信息检索系统结构不同的是,该模型中加入了本体服务器。在本体的帮助下,文档预处理对检索对象进行处理,建立基于概念的索引;文档检索部分的查询转换模块对用户需求进行部分的语义化处理,利用查询表达式中包含概念的上位词、下位词、同义词以及概念的义项对初始查询表达式进行了查询转换,检索代理模块利用转换后的查询表达式到信息源中进行查询。在具体的实现过程中,作者针对检索过程中的关键部分—查询扩展进行了深入的研究,并对扩展结果使用A priori算法进行修剪。文章最后利用本文研究成果实现了一个面向计算机取证领域的信息检索系统,并通过具体数值实验对该系统在查全率和查准率方面进行了性能分析,实验证明该系统具有良好的性能。
论文目录
摘要ABSTRACT第1章 绪论1.1 课题研究目的和意义1.2 课题国内外研究现状1.3 课题的主要研究内容1.4 论文创新点1.5 文章组织结构第2章 信息检索技术2.1 信息检索模型的概念2.2 信息资源和需求表示2.3 信息检索过程2.3.1 信息检索的数学模型2.3.2 特征内容处理2.4 信息检索结果分析2.4.1 影响检索结果排序的因素2.4.2 检索系统评价2.5 当前信息检索的不足2.6 小结第3章 本体论研究3.1 本体的概念3.2 本体的分类3.3 本体的功能3.4 本体的建模元语3.5 本体的描述语言3.5.1 RDF3.5.2 RDFS3.5.3 OWL3.6 构建本体的规则3.7 本体构建工具3.8 本体建模方法3.9 本体在信息检索中的应用3.10 小结第4章 基于领域本体的信息检索系统研究4.1 语义信息检索系统的概念和特点4.2 语义信息检索系统的设计目标4.3 语义信息检索系统的基本思路4.4 传统的向量空间模型4.4.1 基本概念4.4.2 特征项的选择4.4.3 分词4.5 一种基于模糊本体的向量空间模型4.6 基于领域本体的文档处理4.7 基于领域本体的文档检索4.8 小结第5章 基于模糊本体的语义检索系统实现5.1 系统结构5.2 系统开发工具5.3 文档预处理模块5.3.1 PDF、Word、Excel 纯文本提取5.3.2 分词5.4 知识库构建模块5.5 查询语义扩展模块5.6 语义检索模块5.7 检索结果优化模块5.8 系统演示界面5.9 数值试验第6章 总结与展望参考文献致谢攻读硕士学位期间取得的科研成果
相关论文文献
标签:领域本体论文; 概念映射论文; 信息检索论文; 模糊本体论文; 向量空间论文;