基于本体的智能搜索引擎模型ISMBDI的优化研究

基于本体的智能搜索引擎模型ISMBDI的优化研究

论文摘要

随着通讯技术的发展和Internet的普及,网络与人们的工作、生活联系越来越紧密,使用搜索引擎从网络中获取需要的信息已经成为了人们的一种习惯。但随着信息量的增大和行为方式的增多,传统的搜索模式逐渐暴露出许多问题,如:忠实表达问题和机械式匹配问题等。造成这些问题的本质原因是传统搜索引擎不能对用户输入的关健字进行词意分析和扩展,缺乏知识处理能力和理解能力。基于本体的智能搜索模型ISMBDI利用语义Web和本体的相关理论技术,把信息检索从基于关键词层面提高到了基于知识(或概念)层面,有效地解决了上述问题,但ISMBDI模型存在着用户查询界面不够友好、查询结果的处理方式不够人性化、查询效率较低等不足。本文针对ISMBDI模型中存在的问题,以提高系统性能和实用性、使其能够成为适于语义Web上信息共享的公共应用系统模型为目的,利用语义Web、本体和缓存等理论技术进行了相关方面的优化研究。研究内容包括基于概念的用户查询界面的优化、查询结果处理方式的优化和查询处理过程及算法的优化等几个方面。基于统一语义及用户界面友好性的考虑,针对ISMBDI模型中用户查询界面的缺点,设计了一种新的基于概念的用户查询界面。该界面综合了传统查询界面模式的优点和ISMBDI模型中用户查询界面的长处,既缩短了用户建立查询请求的时间,减轻了用户负担,又保证了语义的统一性。在深入分析了ISMBDI模型查询处理过程的基础上,提出了一个查询结果处理方式的优化策略。该策略有效地解决了ISMBDI系统在无百分之百匹配结果时出现的零结果问题,提高了系统的可用性。同时,为了实现该优化策略,提出了一种基于本体的查询请求与查询结果相似度的计算方法。该方法通过匹配成功的模式路径数目与查询请求所包含的模式路径总数之间的运算,为用户提供了查询结果与查询请求相似程度的参考值。为了减轻网络负载、减少系统的响应时间,建立了ISMBDI模型的缓存机制,并提出了一种新的缓存置换策略LRAFU。该策略综合了经典缓存置换算法LRU(最近最少使用)和LFU(最低使用频度)的优点,既避免了缓存污染问题,又适合ISMBDI模型的特点,保证了较高的缓存命中率和利用率。根据查询结果处理方式的优化策略和利用缓存中历史查询回答当前查询的思想,对ISMBDI模型中的关键算法——查询计划生成算法Qplan及其优化算法Qplan_opt进行了改进,使得改进后的算法Qplan_imp具有更加丰富的功能和更快的运算速度。在缓存机制的基础上,提出了一个快速检索机制。该机制充分利用缓存中的历史查询记录,以查全率为代价,极大地缩短了查询时间,提高了查询效率,为查全率要求不高的查询请求提供了一个快速通道。最后,我们对查询处理的关键算法Qplan、原优化算法Qplan opt、改进算法Qplan_imp、快速检索算法Qplan_quick以及缓存置换算法LRAFU进行了实验和分析,验证了本文对ISMBDI系统性能的优化效果。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 论文研究的背景、目的和意义
  • 1.1.1 论文研究的背景
  • 1.1.2 论文研究的目的和意义
  • 1.2 语义Web和智能搜索研究现状概述
  • 1.2.1 语义Web和智能搜索国外研究现状
  • 1.2.2 语义Web和智能搜索国内研究现状
  • 1.3 论文研究的内容
  • 1.4 论文的组织结构
  • 第二章 语义Web、本体、语义智能搜索和ISMBDI模型
  • 2.1 语义Web
  • 2.1.1 语义Web的体系结构
  • 2.1.2 语义Web的关键技术
  • 2.1.2.1 XML
  • 2.1.2.2 RDF和RDFS
  • 2.2 本体(Ontology)
  • 2.2.1 本体的概念
  • 2.2.2 本体的重要性
  • 2.2.3 本体的建模元语
  • 2.2.4 本体的建立
  • 2.2.5 本体的描述语言
  • 2.3 语义智能搜索
  • 2.3.1 基于概念的语义智能搜索的概述
  • 2.3.2 基于概念的语义智能搜索的技术实现
  • 2.4 基于本体的智能搜索引擎模型ISMBDI
  • 2.5 本章小结
  • 第三章 基于本体的智能搜索模型ISMBDI的优化
  • 3.1 ISMBDI模型优化的必要性
  • 3.1.1 搜索引擎性能指标的衡量
  • 3.1.2 ISMBDI模型优化的意义
  • 3.2 用户查询界面的优化
  • 3.2.1 ISMBDI模型中用户查询界面的不足
  • 3.2.2 用户查询界面的优化
  • 3.3 查询结果处理方式的优化
  • 3.3.1 ISMBDI模型中查询结果处理方式的不足
  • 3.3.2 查询结果处理方式的优化策略
  • 3.3.3 基于本体的匹配度计算
  • 3.4 查询过程的优化——设置缓存
  • 3.4.1 搜索引擎设置缓存的依据
  • 3.4.1.1 缓存机制在搜索引擎中的作用
  • 3.4.1.2 用户搜索行为的分析
  • 3.4.2 ISMBDI模型的缓存机制
  • 3.4.2.1 制定缓存置换算法的必要性
  • 3.4.2.2 常用缓存置换算法的分析和比较
  • 3.4.2.3 ISMBDI模型缓存的置换算法——LRAFU
  • 3.4.2.4 ISMBDI模型缓存的存储结构及其特点
  • 3.5 ISMBDI模型关键查询算法的优化
  • 3.6 基于缓存的快速检索机制
  • 3.6.1 建立基于缓存的快速检索机制的依据
  • 3.6.2 基于缓存的查询映射与拆分
  • 3.6.3 基于缓存的查询计划生成策略
  • 3.6.4 基于缓存的快速检索机制的关键算法
  • 3.6.4.1 基于缓存的查询映射算法
  • 3.6.4.2 基于缓存的查询后缀生成算法
  • 3.6.4.3 基于缓存的查询计划生成算法
  • 3.7 本章小结
  • 第四章 算法的运行实验与性能分析
  • 4.1 实验环境
  • 4.2 数据准备
  • 4.2.1 映射规则库的建立
  • 4.2.2 缓存置换算法测试数据的准备
  • 4.3 实验内容与实验结果
  • 4.3.1 四种查询计划生成算法性能测试的实验
  • 4.3.1.1 四种查询计划生成算法性能测试的实验内容
  • 4.3.1.2 四种查询计划生成算法性能测试的实验结果
  • 4.3.2 ISMBDI模型缓存性能测试的实验
  • 4.3.2.1 衡量ISMBDI系统缓存性能的重要指标
  • 4.3.2.2 ISMBDI模型缓存性能测试的实验内容和结果
  • 4.4 本章小结
  • 第五章 总结与展望
  • 5.1 论文工作总结
  • 5.2 进一步的研究工作
  • 参考文献
  • 致谢
  • 攻读学位期间参与的科研项目
  • 攻读学位期间发表和录用的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    基于本体的智能搜索引擎模型ISMBDI的优化研究
    下载Doc文档

    猜你喜欢