基于本体的语义检索原型系统的设计与实现

基于本体的语义检索原型系统的设计与实现

论文摘要

随着计算机网络技术的飞速发展,对计算机信息存储、传输和处理能力的要求迅速增长,对海量信息的检索与利用成为当前一个重要研究和应用领域。传统信息检索方法所采用的基于语法层面上字、词的简单匹配,缺乏对知识的表示、处理和理解的能力。解决这个问题的关键在于把信息检索从基于关键词的语法匹配提升到基于知识层面的语义匹配。本体具有较好的逻辑推理功能,对于用户给出的检索词,利用本体的逻辑推理功能,可判断其所属的领域,然后分别将该领域的相关概念与定义以本体化的形式提供给用户。这样一方面可以帮助用户明确其信息需求,把未意识到的、未清晰表达的客观信息需求进一步显性化;另一方面可以让系统确定检索词在领域本体中的确切位置,从而帮助机器理解用户的检索意图,为用户提供更精确、更相关的知识与信息。基于本体的语义检索利用本体构建概念空间,可以处理概念之间的关系,具有一定的语义处理能力。基于本体的语义检索更符合人类的思维习惯,并且克服传统检索方法造成的信息冗余或信息丢失的缺点,其查询效果更为合理。本文结合信息检索技术和本体技术,在基于本体的语义检索方面主要做了以下研究工作:(1)在对传统信息检索技术和本体技术研究的基础上,提出了一个基于本体和Lucene的语义检索系统模型,该模型在传统的信息检索系统中加入本体,为信息检索系统提供了语义支持,本文阐述了模型的总体设计和各个模块的详细设计;(2)研究了领域本体中概念间的相似性和相关性,提出了概念间相似度和相关度的计算方法,并结合这两项量化指标,提出了一种概念间关系的综合量化方法,该方法充分考虑了概念间的相似度和相关度;(3)在上述工作的基础上,结合查询扩展技术,提出一种了基于本体概念相似度和相关度的查询扩展方法;(4)基于本体的查询扩展和Lucene全文检索工具,设计并实现了一个语义检索原型实验系统。如何进一步把基于本体的语义检索推广应用是今后工作的目标和期望。随着计算机网络技术的飞速发展,对计算机信息存储、传输和处理能力的要求迅速增长,对海量信息的检索与利用成为当前一个重要研究和应用领域。传统信息检索算法所采用的基于语法层面上字、词的简单匹配,而缺乏对知识的表示、处理和理解等能力。解决这些问题的关键在于把信息检索从基于关键字的语法匹配提升到基于知识层面的语义匹配。本体是对概念化的明确描述,它把现实世界中的某个应用领域抽象成一组概念及概念间的关系。将本体融合到传统信息检索技术中,不仅可以继承概念信息检索的优点,还可以克服概念信息检索不能对概念关系进行处理的局限。基于本体的语义检索优于关键词搜索,因为本体包含机器可以判断的概念的定义,从而使系统对领域内的概念,概念之间的联系及领域内的基本公理知识有一个统一的认识,系统通过分析用户提出的查询中所包含的语义,理解用户的查询,并准确地映射到信息资源,从而提高了信息检索系统的查全率和查准率。本文研究了计算机信息检索的基本原理,分析比较了传统信息模型的特点和不足,并介绍了信息检索的研究热点和方向;针对传统信息检索缺乏语义的特点,本文研究了本体这种知识组织的方式,包括本体的基本概念,本体的描述语言,本体创建原则、方法和工具,以及现有的典型的本体,为基于本体论的语义检索奠定了理论基础;本文研究了语义检索的优越性和基于本体的语义的设计思想,并总结了国内外基于本体的语义检索研究状况和成果;本文研究了基于本体的开发工具,包括本体创建和维护工具Protege,本体解析和操作工具包Jena和全文检索工具Lucene,为基于本体的语义检索系统的开发奠定了实现基础。

论文目录

  • 基于本体的语义检索原型系统的设计与实现
  • 摘要
  • AbstraCt
  • 第1章 前言
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 研究内容
  • 1.4 论文组织结构
  • 第2章 基于本体的语义检索模型研究
  • 2.1 基于本体的语义检索概述
  • 2.2 基于本体的语义检索模型设计
  • 2.2.1 本体建立与管理模块
  • 2.2.2 信息获取模块
  • 2.2.3 Lucene检索引擎模块
  • 2.2.4 用户查询扩展和结果反馈模块
  • 第3章 基于本体的概念语义相似度和相关度研究
  • 3.1 概念语义相似度和相关度研究概述
  • 3.1.1 语义相似度和相关度
  • 3.1.2 语义相似度和相关度常用的计算方法
  • 3.1.3 语义相似度和相关度的评估方法
  • 3.1.4 概念语义相似度和相关度的研究现状
  • 3.2 基于知网的词语语义相似度计算方法研究
  • 3.2.1 知网简介
  • 3.2.2 基于知网的词语语义相似度计算
  • 3.3 基于领域本体的概念语义相似度和相关度计算研究
  • 3.3.1 基于领域本体的概念语义相似度计算
  • 3.3.2 基于领域本体的概念语义相关度计算
  • 3.3.3 结合领域本体的语义相似度和语义相关度的计算方法
  • 第4章 基于概念相似度和相关度的查询扩展研究
  • 4.1 查询扩展技术概述
  • 4.2 基于本体的查询扩展研究
  • 4.3 基于领域本体概念间相似度和相关度的查询扩展
  • 第5章 基于本体的语义检索原型系统设计与实现
  • 5.1 系统开发平台及工具
  • 5.2 基于本体的语义检索原型系统各模块的设计与实现
  • 5.2.1 本体建立与管理模块的设计与实现
  • 5.2.2 信息获取模块的设计与实现
  • 5.2.3 Lucene检索引擎模块的设计与实现
  • 5.2.4 用户查询扩展和结果反馈模块的设计与实现
  • 5.3 基于本体的语义检索系统和传统信息检索系统的检索效果对比
  • 第6章 结束语
  • 6.1 论文总结
  • 6.2 下一步工作展望
  • 参考文献
  • 基于本体的语义检索研究综述
  • 摘要
  • 第1章 信息检索
  • 1.1 信息检索概述
  • 1.2 信息检索原理
  • 1.3 信息检索的性能评价
  • 1.4 传统信息检索模型
  • 1.4.1 布尔检索模型
  • 1.4.2 向量空间模型
  • 1.4.3 概率模型
  • 1.4.4 经典模型比较
  • 1.4.5 传统信息检索模型的弊端
  • 1.5 信息检索的研究热点与方向
  • 1.5.1 智能检索和知识检索
  • 1.5.2 知识挖掘
  • 1.5.3 异构信息整合检索和全息检索
  • 1.6 本章小结
  • 第2章 本体
  • 2.1 本体的基本概念
  • 2.1.1 本体的定义
  • 2.1.2 本体的组成
  • 2.1.3 本体分类
  • 2.2 本体描述语言
  • 2.2.1 本体描述语言概述
  • 2.2.2 OWL简介
  • 2.2.3 其它本体描述语言
  • 2.3 本体创建原则、方法和工具
  • 2.3.1 本体创建原则
  • 2.3.2 本体创建方法
  • 2.3.3 本体开发工具
  • 2.4 典型本体介绍
  • 2.4.1 CYC
  • 2.4.2 WordNet
  • 2.4.3 SUMO
  • 2.4.4 知网(HowNet)
  • 2.4.5 国家知识基础设施(NKI)
  • 2.5 本章小结
  • 第3章 基于本体的语义检索
  • 3.1 语义检索概述
  • 3.2 语义检索系统的功能
  • 3.3 基于本体的语义检索的设计思想
  • 3.4 基于本体的语义检索相关研究
  • 3.4.1 国外基于本体的语义检索研究
  • 3.4.2 国内基于本体的语义检索研究
  • 3.5 本章小结
  • 第4章 基于本体的语义检索系统开发工具
  • 4.1 Protege简介
  • 4.2 Jena简介
  • 4.3 Lucene简介
  • 4.3.1 Lucene开发包简介
  • 4.3.2 Lucene实现全文检索的步骤
  • 4.3.3 Lucene的评分公式
  • 4.4 本章小结
  • 参考文献
  • The Design and Implemntation of Semantic Retriveal Prototype System Based-on Ontology
  • Abstract
  • Chapter 1 Introduce
  • 1.1 Research Background and Significance
  • 1.2 Research Status in Domestic and Abroad
  • 1.3 Research Contents
  • 1.4 Paper Organizational Structure
  • Chapter 2 Model of Semantic Retrieval Based-on Ontology Research
  • 2.1 Semantic Retrieval Based-on Ontology
  • 2.2 The Design of Semantic Retrieval Based-on Ontology Model
  • 2.2.1 Ontology establishment and management module
  • 2.2.2 Information access module
  • 2.2.3 Lucene retrieval engine module
  • 2.2.4 User information query expansion and results feedback module
  • Chapter 3 Research of Concepts Semantic Similarity and RelevanceBased-on Ontology
  • 3.1 Research of Concepts Semantic Similarity and Relevance
  • 3.1.1 Semantic similarity and relevance
  • 3.1.2 Common calculation method of semantic similarity and relevance
  • 3.1.3 Assessment method of semantic similarity and relevance
  • 3.1.4 Research Status of semantic similarity and relevance
  • 3.2 Words Semantic Similarity Calculation Based-on HowNet
  • 3.2.1 HowNet introduce
  • 3.2.2 Words semantic similarity calculation based-on HowNet
  • 3.3 Concepts Semantic Similarity and Relevance Calculation Based-on Domain Ontology
  • 3.3.1 Concepts semantic similarity calculation based-on domain ontology
  • 3.3.2 Concepts semantic Relevance calculation based-on domain ontology
  • 3.3.3 Calculation method combines concepts semantic similarity with relevance based-on domain ontology
  • Chapter 4 Query Expansion Based-on Concepts Semantic Similarity andRelevance
  • 4.1 Query Expansion Technology
  • 4.2 Query Expansion Based-on Ontology
  • 4.3 Query Expansion Based-on Concepts Semantic Similarity and Relevance
  • Chapter 5 Design and Implementation of Semantic Retrieval PrototypeSystem Based-on Ontology
  • 5.1 The development platform and tools of system
  • 5.2 Design and implementation of module in semantic retrieval prototype system based-on ontology
  • 5.2.1 Design and implementation of ontology establishment and management module
  • 5.2.2 Design and implementation of information access module
  • 5.2.3 Design and implementation of Lucene retrieval engine module
  • 5.2.4 Design and implementation of user information query expansion and results feedback module
  • 5.3 The Effectiveness Comparison of Semantic Retrieval Prototype System and Traditional Information Retrieval System
  • Chapter 6 Concluding Remarks
  • 6.1 Paper Concluded
  • 6.2 The Outlook of Next Step
  • Reference
  • Summary of Research on Ontology-based Semantic Retrieval
  • Abstract
  • Chapter 1 Information Retrieval
  • 1.1 Overview of Information Retrieval
  • 1.2 Theory of Information Retrieval
  • 1.3 Performance Evaluation of Information Retrieval
  • 1.4 Traditional Model of Information Retrieval
  • 1.4.1 Boolean retrieval model
  • 1.4.2 Vector space model
  • 1.4.3 Probabilistic model
  • 1.4.4 Comparison of classical model
  • 1.4.5 Defects of traditional model of information retrieval
  • 1.5 Information Retrieval Research Focus and Direction
  • 1.5.1 Intelligent retrieval and knowledge retrieval
  • 1.5.2 Knowledge mining
  • 1.5.3 Integration retrieval of heterogeneous information and overall information retrieval
  • 1.6 Chapter Summary
  • Chapter 2 Ontology
  • 2.1 The Basic Concept of Ontology
  • 2.1.1 The definition of ontology
  • 2.1.2 The composition of ontology
  • 2.1.3 Ontology category
  • 2.2 Description Language of Ontology
  • 2.2.1 Description language of ontology overview
  • 2.2.2 OWL summary
  • 2.2.3 Other description language of ontology
  • 2.3 Ontology Development Principles, Methods and Tools
  • 2.3.1 Ontology development principles
  • 2.3.2 Ontology development methods
  • 2.3.3 Development tools of ontology
  • 2.4 Typical Ontology Introduction
  • 2.4.1 CYC
  • 2.4.2 WordNet
  • 2.4.3 SUMO
  • 2.4.4 HowNet
  • 2.4.5 NKI
  • 2.5 Chapter Summary
  • Chapter 3 Semantic Retrieval Based-on Ontology
  • 3.1 Semantic Retrieval Summary
  • 3.2 The Function of Semantic Retrieval System
  • 3.3 The Design Idea of Semantic Retrieval Based-on Ontology
  • 3.4 The Related Research of Semantic Retrieval Based-on Ontology
  • 3.4.1 The research of semantic retrieval based-on ontology in abroad
  • 3.4.2 The research of semantic retrieval based-on ontology in domestic
  • 3.5 Chapter Summary
  • Chapter 4 Semantic Retrieval Based-on Ontology System DevelopmentTools
  • 4.1 Protege Summary
  • 4.2 Jena Summary
  • 4.3 Lucene Summary
  • 4.3.1 Lucene package
  • 4.3.2 The steps of Lucene realize a full text retrieval function
  • 4.3.3 Lueene score formula
  • 4.4 Chapter Summary
  • Reference
  • 攻读学位期间发表的学术论文和研究成果
  • 致谢
  • 相关论文文献

    • [1].关于“信息检索学”是否存在问题的探讨[J]. 中国索引 2012(03)
    • [2].从新视角开展信息检索建模研究[J]. 中国出版 2020(08)
    • [3].在线健康信息检索行为实验研究内容梳理及启示[J]. 图书情报工作 2020(03)
    • [4].情境感知视角下的信息检索发展研究[J]. 图书情报导刊 2020(04)
    • [5].计算机信息检索对图书情报的影响分析[J]. 中国新通信 2020(17)
    • [6].任务情境下的儿童信息检索行为研究[J]. 图书馆理论与实践 2019(05)
    • [7].企业用户信息检索模式研究[J]. 中国管理信息化 2019(18)
    • [8].探讨现代信息检索对图书馆信息服务的影响[J]. 办公室业务 2019(22)
    • [9].“信息检索与利用”混合式教学中实践教学作业设置探讨[J]. 江苏科技信息 2018(13)
    • [10].基于蓝墨云班课的翻转课堂教学实践——以高职“信息检索”课程为例[J]. 中国信息技术教育 2017(01)
    • [11].信息检索在公安管理中的应用探讨[J]. 山西青年 2017(02)
    • [12].检索是一种素养[J]. 大学生 2017(07)
    • [13].自学检索[J]. 大学生 2017(10)
    • [14].信息检索服务小微企业的探析——基于“大众创业、万众创新”背景[J]. 科技创业月刊 2016(04)
    • [15].网络档案信息检索的元数据设计[J]. 山西档案 2020(01)
    • [16].巧用智能手机拓展高职信息检索课堂[J]. 北极光 2019(03)
    • [17].跨语言信息检索中的最关联英文语义翻译选取[J]. 现代电子技术 2017(12)
    • [18].雨课堂在《信息检索与利用》课程教学中的应用实践[J]. 中国教育信息化 2017(20)
    • [19].研究生与本科生信息检索焦虑研究[J]. 图书馆学刊 2015(11)
    • [20].网络环境下的图像信息检索行为的现状调查及优化对策[J]. 科教文汇(上旬刊) 2014(10)
    • [21].微信辅助信息检索教学的SWOT分析[J]. 中国新通信 2014(24)
    • [22].开放网络知识的信息检索与数据挖掘探究[J]. 电脑迷 2016(09)
    • [23].高校图书馆读者信息检索竞赛活动研究[J]. 新世纪图书馆 2014(10)
    • [24].跨语言信息检索在搜索引擎中的应用[J]. 中小企业管理与科技(上旬刊) 2013(04)
    • [25].艺术信息检索[J]. 大舞台 2012(03)
    • [26].我国企业信息检索存在的通病与对策[J]. 重庆与世界(学术版) 2012(07)
    • [27].财经院校经济信息检索与利用教育模式的构建[J]. 高等财经教育研究 2012(04)
    • [28].网络环境下高职院校信息检索教育的思考[J]. 科技信息 2009(31)
    • [29].2006-2007年国外用户信息检索行为研究述评[J]. 图书馆建设 2008(03)
    • [30].医科院校信息检索教育形式多样化的研究[J]. 科技情报开发与经济 2008(18)

    标签:;  ;  ;  ;  ;  ;  

    基于本体的语义检索原型系统的设计与实现
    下载Doc文档

    猜你喜欢