论文摘要
随着计算机网络技术的飞速发展,对计算机信息存储、传输和处理能力的要求迅速增长,对海量信息的检索与利用成为当前一个重要研究和应用领域。传统信息检索方法所采用的基于语法层面上字、词的简单匹配,缺乏对知识的表示、处理和理解的能力。解决这个问题的关键在于把信息检索从基于关键词的语法匹配提升到基于知识层面的语义匹配。本体具有较好的逻辑推理功能,对于用户给出的检索词,利用本体的逻辑推理功能,可判断其所属的领域,然后分别将该领域的相关概念与定义以本体化的形式提供给用户。这样一方面可以帮助用户明确其信息需求,把未意识到的、未清晰表达的客观信息需求进一步显性化;另一方面可以让系统确定检索词在领域本体中的确切位置,从而帮助机器理解用户的检索意图,为用户提供更精确、更相关的知识与信息。基于本体的语义检索利用本体构建概念空间,可以处理概念之间的关系,具有一定的语义处理能力。基于本体的语义检索更符合人类的思维习惯,并且克服传统检索方法造成的信息冗余或信息丢失的缺点,其查询效果更为合理。本文结合信息检索技术和本体技术,在基于本体的语义检索方面主要做了以下研究工作:(1)在对传统信息检索技术和本体技术研究的基础上,提出了一个基于本体和Lucene的语义检索系统模型,该模型在传统的信息检索系统中加入本体,为信息检索系统提供了语义支持,本文阐述了模型的总体设计和各个模块的详细设计;(2)研究了领域本体中概念间的相似性和相关性,提出了概念间相似度和相关度的计算方法,并结合这两项量化指标,提出了一种概念间关系的综合量化方法,该方法充分考虑了概念间的相似度和相关度;(3)在上述工作的基础上,结合查询扩展技术,提出一种了基于本体概念相似度和相关度的查询扩展方法;(4)基于本体的查询扩展和Lucene全文检索工具,设计并实现了一个语义检索原型实验系统。如何进一步把基于本体的语义检索推广应用是今后工作的目标和期望。随着计算机网络技术的飞速发展,对计算机信息存储、传输和处理能力的要求迅速增长,对海量信息的检索与利用成为当前一个重要研究和应用领域。传统信息检索算法所采用的基于语法层面上字、词的简单匹配,而缺乏对知识的表示、处理和理解等能力。解决这些问题的关键在于把信息检索从基于关键字的语法匹配提升到基于知识层面的语义匹配。本体是对概念化的明确描述,它把现实世界中的某个应用领域抽象成一组概念及概念间的关系。将本体融合到传统信息检索技术中,不仅可以继承概念信息检索的优点,还可以克服概念信息检索不能对概念关系进行处理的局限。基于本体的语义检索优于关键词搜索,因为本体包含机器可以判断的概念的定义,从而使系统对领域内的概念,概念之间的联系及领域内的基本公理知识有一个统一的认识,系统通过分析用户提出的查询中所包含的语义,理解用户的查询,并准确地映射到信息资源,从而提高了信息检索系统的查全率和查准率。本文研究了计算机信息检索的基本原理,分析比较了传统信息模型的特点和不足,并介绍了信息检索的研究热点和方向;针对传统信息检索缺乏语义的特点,本文研究了本体这种知识组织的方式,包括本体的基本概念,本体的描述语言,本体创建原则、方法和工具,以及现有的典型的本体,为基于本体论的语义检索奠定了理论基础;本文研究了语义检索的优越性和基于本体的语义的设计思想,并总结了国内外基于本体的语义检索研究状况和成果;本文研究了基于本体的开发工具,包括本体创建和维护工具Protege,本体解析和操作工具包Jena和全文检索工具Lucene,为基于本体的语义检索系统的开发奠定了实现基础。
论文目录
基于本体的语义检索原型系统的设计与实现摘要AbstraCt第1章 前言1.1 研究背景及意义1.2 国内外研究现状1.3 研究内容1.4 论文组织结构第2章 基于本体的语义检索模型研究2.1 基于本体的语义检索概述2.2 基于本体的语义检索模型设计2.2.1 本体建立与管理模块2.2.2 信息获取模块2.2.3 Lucene检索引擎模块2.2.4 用户查询扩展和结果反馈模块第3章 基于本体的概念语义相似度和相关度研究3.1 概念语义相似度和相关度研究概述3.1.1 语义相似度和相关度3.1.2 语义相似度和相关度常用的计算方法3.1.3 语义相似度和相关度的评估方法3.1.4 概念语义相似度和相关度的研究现状3.2 基于知网的词语语义相似度计算方法研究3.2.1 知网简介3.2.2 基于知网的词语语义相似度计算3.3 基于领域本体的概念语义相似度和相关度计算研究3.3.1 基于领域本体的概念语义相似度计算3.3.2 基于领域本体的概念语义相关度计算3.3.3 结合领域本体的语义相似度和语义相关度的计算方法第4章 基于概念相似度和相关度的查询扩展研究4.1 查询扩展技术概述4.2 基于本体的查询扩展研究4.3 基于领域本体概念间相似度和相关度的查询扩展第5章 基于本体的语义检索原型系统设计与实现5.1 系统开发平台及工具5.2 基于本体的语义检索原型系统各模块的设计与实现5.2.1 本体建立与管理模块的设计与实现5.2.2 信息获取模块的设计与实现5.2.3 Lucene检索引擎模块的设计与实现5.2.4 用户查询扩展和结果反馈模块的设计与实现5.3 基于本体的语义检索系统和传统信息检索系统的检索效果对比第6章 结束语6.1 论文总结6.2 下一步工作展望参考文献基于本体的语义检索研究综述摘要第1章 信息检索1.1 信息检索概述1.2 信息检索原理1.3 信息检索的性能评价1.4 传统信息检索模型1.4.1 布尔检索模型1.4.2 向量空间模型1.4.3 概率模型1.4.4 经典模型比较1.4.5 传统信息检索模型的弊端1.5 信息检索的研究热点与方向1.5.1 智能检索和知识检索1.5.2 知识挖掘1.5.3 异构信息整合检索和全息检索1.6 本章小结第2章 本体2.1 本体的基本概念2.1.1 本体的定义2.1.2 本体的组成2.1.3 本体分类2.2 本体描述语言2.2.1 本体描述语言概述2.2.2 OWL简介2.2.3 其它本体描述语言2.3 本体创建原则、方法和工具2.3.1 本体创建原则2.3.2 本体创建方法2.3.3 本体开发工具2.4 典型本体介绍2.4.1 CYC2.4.2 WordNet2.4.3 SUMO2.4.4 知网(HowNet)2.4.5 国家知识基础设施(NKI)2.5 本章小结第3章 基于本体的语义检索3.1 语义检索概述3.2 语义检索系统的功能3.3 基于本体的语义检索的设计思想3.4 基于本体的语义检索相关研究3.4.1 国外基于本体的语义检索研究3.4.2 国内基于本体的语义检索研究3.5 本章小结第4章 基于本体的语义检索系统开发工具4.1 Protege简介4.2 Jena简介4.3 Lucene简介4.3.1 Lucene开发包简介4.3.2 Lucene实现全文检索的步骤4.3.3 Lucene的评分公式4.4 本章小结参考文献The Design and Implemntation of Semantic Retriveal Prototype System Based-on OntologyAbstractChapter 1 Introduce1.1 Research Background and Significance1.2 Research Status in Domestic and Abroad1.3 Research Contents1.4 Paper Organizational StructureChapter 2 Model of Semantic Retrieval Based-on Ontology Research2.1 Semantic Retrieval Based-on Ontology2.2 The Design of Semantic Retrieval Based-on Ontology Model2.2.1 Ontology establishment and management module2.2.2 Information access module2.2.3 Lucene retrieval engine module2.2.4 User information query expansion and results feedback moduleChapter 3 Research of Concepts Semantic Similarity and RelevanceBased-on Ontology3.1 Research of Concepts Semantic Similarity and Relevance3.1.1 Semantic similarity and relevance3.1.2 Common calculation method of semantic similarity and relevance3.1.3 Assessment method of semantic similarity and relevance3.1.4 Research Status of semantic similarity and relevance3.2 Words Semantic Similarity Calculation Based-on HowNet3.2.1 HowNet introduce3.2.2 Words semantic similarity calculation based-on HowNet3.3 Concepts Semantic Similarity and Relevance Calculation Based-on Domain Ontology3.3.1 Concepts semantic similarity calculation based-on domain ontology3.3.2 Concepts semantic Relevance calculation based-on domain ontology3.3.3 Calculation method combines concepts semantic similarity with relevance based-on domain ontologyChapter 4 Query Expansion Based-on Concepts Semantic Similarity andRelevance4.1 Query Expansion Technology4.2 Query Expansion Based-on Ontology4.3 Query Expansion Based-on Concepts Semantic Similarity and RelevanceChapter 5 Design and Implementation of Semantic Retrieval PrototypeSystem Based-on Ontology5.1 The development platform and tools of system5.2 Design and implementation of module in semantic retrieval prototype system based-on ontology5.2.1 Design and implementation of ontology establishment and management module5.2.2 Design and implementation of information access module5.2.3 Design and implementation of Lucene retrieval engine module5.2.4 Design and implementation of user information query expansion and results feedback module5.3 The Effectiveness Comparison of Semantic Retrieval Prototype System and Traditional Information Retrieval SystemChapter 6 Concluding Remarks6.1 Paper Concluded6.2 The Outlook of Next StepReferenceSummary of Research on Ontology-based Semantic RetrievalAbstractChapter 1 Information Retrieval1.1 Overview of Information Retrieval1.2 Theory of Information Retrieval1.3 Performance Evaluation of Information Retrieval1.4 Traditional Model of Information Retrieval1.4.1 Boolean retrieval model1.4.2 Vector space model1.4.3 Probabilistic model1.4.4 Comparison of classical model1.4.5 Defects of traditional model of information retrieval1.5 Information Retrieval Research Focus and Direction1.5.1 Intelligent retrieval and knowledge retrieval1.5.2 Knowledge mining1.5.3 Integration retrieval of heterogeneous information and overall information retrieval1.6 Chapter SummaryChapter 2 Ontology2.1 The Basic Concept of Ontology2.1.1 The definition of ontology2.1.2 The composition of ontology2.1.3 Ontology category2.2 Description Language of Ontology2.2.1 Description language of ontology overview2.2.2 OWL summary2.2.3 Other description language of ontology2.3 Ontology Development Principles, Methods and Tools2.3.1 Ontology development principles2.3.2 Ontology development methods2.3.3 Development tools of ontology2.4 Typical Ontology Introduction2.4.1 CYC2.4.2 WordNet2.4.3 SUMO2.4.4 HowNet2.4.5 NKI2.5 Chapter SummaryChapter 3 Semantic Retrieval Based-on Ontology3.1 Semantic Retrieval Summary3.2 The Function of Semantic Retrieval System3.3 The Design Idea of Semantic Retrieval Based-on Ontology3.4 The Related Research of Semantic Retrieval Based-on Ontology3.4.1 The research of semantic retrieval based-on ontology in abroad3.4.2 The research of semantic retrieval based-on ontology in domestic3.5 Chapter SummaryChapter 4 Semantic Retrieval Based-on Ontology System DevelopmentTools4.1 Protege Summary4.2 Jena Summary4.3 Lucene Summary4.3.1 Lucene package4.3.2 The steps of Lucene realize a full text retrieval function4.3.3 Lueene score formula4.4 Chapter SummaryReference攻读学位期间发表的学术论文和研究成果致谢
相关论文文献
- [1].关于“信息检索学”是否存在问题的探讨[J]. 中国索引 2012(03)
- [2].从新视角开展信息检索建模研究[J]. 中国出版 2020(08)
- [3].在线健康信息检索行为实验研究内容梳理及启示[J]. 图书情报工作 2020(03)
- [4].情境感知视角下的信息检索发展研究[J]. 图书情报导刊 2020(04)
- [5].计算机信息检索对图书情报的影响分析[J]. 中国新通信 2020(17)
- [6].任务情境下的儿童信息检索行为研究[J]. 图书馆理论与实践 2019(05)
- [7].企业用户信息检索模式研究[J]. 中国管理信息化 2019(18)
- [8].探讨现代信息检索对图书馆信息服务的影响[J]. 办公室业务 2019(22)
- [9].“信息检索与利用”混合式教学中实践教学作业设置探讨[J]. 江苏科技信息 2018(13)
- [10].基于蓝墨云班课的翻转课堂教学实践——以高职“信息检索”课程为例[J]. 中国信息技术教育 2017(01)
- [11].信息检索在公安管理中的应用探讨[J]. 山西青年 2017(02)
- [12].检索是一种素养[J]. 大学生 2017(07)
- [13].自学检索[J]. 大学生 2017(10)
- [14].信息检索服务小微企业的探析——基于“大众创业、万众创新”背景[J]. 科技创业月刊 2016(04)
- [15].网络档案信息检索的元数据设计[J]. 山西档案 2020(01)
- [16].巧用智能手机拓展高职信息检索课堂[J]. 北极光 2019(03)
- [17].跨语言信息检索中的最关联英文语义翻译选取[J]. 现代电子技术 2017(12)
- [18].雨课堂在《信息检索与利用》课程教学中的应用实践[J]. 中国教育信息化 2017(20)
- [19].研究生与本科生信息检索焦虑研究[J]. 图书馆学刊 2015(11)
- [20].网络环境下的图像信息检索行为的现状调查及优化对策[J]. 科教文汇(上旬刊) 2014(10)
- [21].微信辅助信息检索教学的SWOT分析[J]. 中国新通信 2014(24)
- [22].开放网络知识的信息检索与数据挖掘探究[J]. 电脑迷 2016(09)
- [23].高校图书馆读者信息检索竞赛活动研究[J]. 新世纪图书馆 2014(10)
- [24].跨语言信息检索在搜索引擎中的应用[J]. 中小企业管理与科技(上旬刊) 2013(04)
- [25].艺术信息检索[J]. 大舞台 2012(03)
- [26].我国企业信息检索存在的通病与对策[J]. 重庆与世界(学术版) 2012(07)
- [27].财经院校经济信息检索与利用教育模式的构建[J]. 高等财经教育研究 2012(04)
- [28].网络环境下高职院校信息检索教育的思考[J]. 科技信息 2009(31)
- [29].2006-2007年国外用户信息检索行为研究述评[J]. 图书馆建设 2008(03)
- [30].医科院校信息检索教育形式多样化的研究[J]. 科技情报开发与经济 2008(18)
标签:信息检索论文; 本体论文; 语义检索论文; 概念相似度论文; 概念相关度论文; 查询扩展论文;