论文摘要
搜索引擎作为信息导航和检索的入口,越来越多的应用到互联网中的实际领域。用户检索的效率作为搜索引擎的一项重要的评价标准则引导着搜索引擎的不断发展。传统基于文本检索的搜索引擎已经逐渐被淘汰,而能够很好的理解用户查询需求的智能搜索引擎则成为现今研究的重点。本文首先分析了搜索引擎智能化发展的趋势,说明了解决传统搜索引擎检索效率低下的关键是提高搜索引擎的知识处理能力和语义理解能力。其次,通过对本体论的相关技术理论的学习,将本体论构建语义模型的能力应用到搜索引擎的智能化研究当中,提出了一种基于本体论的智能搜索引擎系统框架。该框架在进行网页信息搜集时进行了基于本体的标注,并建立倒排序表。在用户进行查询的时候,可以通过人机交互,使得查询表达式详细以及本体化,进而可以对查询内容进行基于知识的检索。它主要由网页爬行部分,本体处理部分,预处理部分,查询处理部分四部分组成。其中本文主要研究了本体库建模,解析网页信息,网页爬行策略,本体元数据倒排序表的建立,网页本体标注,本体匹配,用户查询的本体表达,相关词条的实现以及查询处理时的用户界面等几个方面。最后,本文对框架的运行结果进行分析比较,说明了本文系统框架可以较好得理解用户查询请求,并可以对搜集到的网页信息进行语义处理,从而增加了搜索引擎的自动化和智能化程度,大大提高了检索效率。
论文目录
摘要Abstract第一章 绪论1.1 研究背景1.1.1 Internet 概述1.1.2 Internet 信息特点1.1.3 传统搜索技术的局限性1.2 论文研究的内容、目的和意义1.3 论文的章节安排第二章 关键技术概述2.1 搜索引擎概述2.1.1 定义2.1.2 分类2.1.3 工作原理2.1.4 评价标准2.1.5 发展趋势2.2 本体论概述2.2.1 定义2.2.2 建模原语2.2.3 本体与语义网络2.2.4 本体建设的方法论2.2.5 本体的应用现状第三章 搜索引擎框架的实现方式分析3.1 概述3.1.1 现有语义检索框架3.1.2 现有框架的局限性3.1.3 本文框架的适用性3.2 系统总体框架3.3 网页搜集模块3.4 本体处理模块3.4.1 本体的建立3.4.2 Jena 接口3.4.3 本体标注模块3.4.4 本体匹配模块3.4.5 本体表达模块3.5 预处理模块3.6 查询处理模块3.6.1 查询模块3.6.2 结果排序模块第四章 搜索引擎框架的实现4.1 系统概述4.1.1 开发环境4.1.2 系统结构4.1.3 系统可行性分析4.2 本体库建模4.2.1 类库4.2.2 实例库4.3 网页搜集模块4.4 本体处理模块4.4.1 本体标注模块4.4.2 本体匹配模块4.4.3 本体表达模块4.5 预处理模块4.6 查询处理模块4.7 系统测评4.7.1 测试环境4.7.2 测试内容4.7.3 测试结果4.7.4 结果分析第五章 结束语5.1 工作总结5.2 下一步展望致谢参考文献
相关论文文献
标签:本体论文; 搜索引擎论文; 智能化论文;