基于本体的分类检索系统的设计与实现

基于本体的分类检索系统的设计与实现

论文摘要

随着信息时代的飞速发展,网络上的信息量是越来越大,虽然信息量愈加丰富,但是人们在网上查找自己需要的信息却变得越来越困难。某些搜索引擎为人们从大量的网页中迅速查找有效信息提供了工具,但是,从目前国内外研究状况来看,现有的搜索引擎所用的检索系统很难令人满意,原因主要在于:检索系统问题分类不精确导致最终答案与问题主题偏离;现有的答案抽取相关技术大多基于统计的方法,忽略了句子的语义,这样就会使得查询结果存在大量无用和冗余的信息,因此影响了答案的准确率。要提高现有检索系统的精度,就必须解决好上面提到的问题。本文讨论的信息检索系统尝试改变这个情况,利用本体(ontology)知识,使得返回结果更加丰富和精确。本体(ontology)是一种用来描述概念以及概念和概念之间关系的模型,并能从不同层次的形式化模式上给出词汇和词汇之间相互关系的明确定义。其中,领域本体包含着比较完整的知识和丰富的语义关系,把这些资源通过一种方法应用到信息检索系统中,使得一定程度上解决目前检索系统中语义的理解不足的问题成为可能。基于此,本文提出了一种基于本体的分类检索系统,利用本体中丰富的语义关系,从语义层次上揭示文档本身和文档之间的关系,对用户提问进行分类语义查询,从而提高信息检索的查准率和查全率。本系统功能模块主要分为三部分:利用实验性领域本体,进行存储与维护;对问题集进行分类预处理;对用户问题进行预处理,即分析、归类、扩展、查询,最终将检索结果返回。本系统的运行过程主要可以分为以下几个步骤:对问题集合进行分析与处理,并通过分类与本体概念进行映射;对本体文件进行解析,计算各个概念的权重,按树状结构存储到数据库中;用户输入需要查询的问题并提交;对用户的提问进行分析,抽取本体概念以及常识概念;对本体概念进行本体树上的扩展,并得到一组候选问题集;利用本体计算出用户提问与候选问句的相似度,用户根据结果符合程度决定是否再次查询。

论文目录

  • 摘要
  • Abstract
  • 1. 引言
  • 1.1 研究背景与意义
  • 1.2 信息检索研究概况
  • 1.2.1 布尔模型
  • 1.2.2 概率模型
  • 1.2.3 搜索引擎技术
  • 1.2.4 向量空间模型
  • 1.3 问题分类相关技术分析
  • 1.4 答案查询及信息抽取相关技术分析
  • 1.4.1 命名实体识别
  • 1.4.2 模式匹配模型
  • 1.4.3 潜在语义分析
  • 1.4.4 自然语言处理技术
  • 1.5 研究内容及论文结构
  • 2. 本体及农业领域本体
  • 2.1 本体的概念
  • 2.2 本体研究状况
  • 2.2.1 W3C 的研究
  • 2.2.2 NKI 的研究
  • 2.2.3 KSL 的研究
  • 2.3 本体的分类
  • 2.4 领域本体的构造方法
  • 2.4.1 构造领域本体的原则
  • 2.4.2 构造领域本体的方法步骤
  • 2.5 农业知识本体体系
  • 3. 基于本体的分类检索系统框架及关键技术
  • 3.1 基于领域本体的信息检索的一般流程
  • 3.2 系统框架
  • 3.3 基于本体的文本分类
  • 3.3.1 文本分类
  • 3.3.2 基于本体的VSM
  • 3.3.3 构造本体概念的特征向量
  • 3.3.4 构造文本特征向量
  • 3.3.5 文本分类的算法设计
  • 3.4 基于本体的查询
  • 3.5 相似度计算
  • 3.5.1 词语之间的语义相似度
  • 3.5.2 一种综合的语义相似度计算模型
  • 4. 基于本体的分类检索系统的设计与实现
  • 4.1 本体在MYSQL 中的存储
  • 4.1.1 Jena 的数据库接口
  • 4.1.2 Jena 的数据库模式
  • 4.1.3 创建本体的持久模型
  • 4.1.4 将本体存入MySQL
  • 4.2 文本分类模块的实现与评测
  • 4.3 本文的相似度计算模型与传统计算模型的试验对比
  • 4.4 基于农作物领域本体的分类检索系统的实现
  • 5. 总结与展望
  • 5.1 工作总结
  • 5.2 下一步研究的问题
  • 参考文献
  • 在读期间发表的论文
  • 作者简介
  • 致谢
  • 相关论文文献

    • [1].《本体二》[J]. 美苑 2015(S1)
    • [2].渺茫的本体[J]. 中国诗歌 2018(03)
    • [3].虫梦[J]. 意林(少年版) 2010(08)
    • [4].基于程序语义的本体表示方法[J]. 信息系统工程 2017(08)
    • [5].本体评估方法研究综述[J]. 计算机应用研究 2015(03)
    • [6].基于测试用例的应用本体需求验证方法研究[J]. 图书与情报 2013(01)
    • [7].本体演化管理的方法和关键技术研究进展[J]. 图书情报工作 2011(14)
    • [8].工业4.0本体标准及其场景[J]. 国外社会科学前沿 2020(04)
    • [9].基于图数据库的本体查询与推理[J]. 机电产品开发与创新 2019(01)
    • [10].本体对齐技术概述及其在中医领域的应用探讨[J]. 世界科学技术-中医药现代化 2017(01)
    • [11].二人转艺术本体溯源[J]. 剧作家 2010(01)
    • [12].数据本体的概念及意义解析[J]. 岭南学刊 2020(06)
    • [13].中国哲学的“本体”概念与“本体论”[J]. 哲学研究 2010(09)
    • [14].基于群体行为的协同构建本体可信度研究[J]. 情报杂志 2015(06)
    • [15].关注语文本体 提升核心素养[J]. 小学教学参考 2018(34)
    • [16].基于本体的高校图书馆知识地图研究[J]. 图书馆学研究 2012(17)
    • [17].领域本体的构建方法研究[J]. 图书与情报 2011(01)
    • [18].基于描述逻辑的本体进化框架[J]. 计算机工程 2010(13)
    • [19].近两年来国外有关本体基本问题的主要研究述评[J]. 图书馆建设 2008(08)
    • [20].本体的追问和本体的内容[J]. 内蒙古社会科学(汉文版) 2008(05)
    • [21].回归本体 激浊扬清——书法批评的历史回顾与反思[J]. 中国书法 2019(12)
    • [22].人类本体观的历史与价值审视[J]. 阅江学刊 2019(05)
    • [23].广益[J]. 上海艺术评论 2017(03)
    • [24].本体评估研究进展[J]. 情报学报 2016(07)
    • [25].“诗意”之“静”与“美感”之“动”的辩证体现——《形上本体诗学》之“客观诗本体”诗学原理浅析[J]. 河南师范大学学报(哲学社会科学版) 2016(04)
    • [26].基于本体论的大学本体的探究[J]. 现代教育管理 2016(09)
    • [27].客体、主体与道体——论本体的形态[J]. 哲学研究 2013(04)
    • [28].生物医学本体工程进展[J]. 中国数字医学 2012(11)
    • [29].中国哲学中的本体之“诗”[J]. 西北人文科学评论 2009(00)
    • [30].本体构建研究综述[J]. 现代计算机(专业版) 2012(14)

    标签:;  ;  ;  ;  

    基于本体的分类检索系统的设计与实现
    下载Doc文档

    猜你喜欢