论文摘要
随着通讯技术的发展和Internet的普及,网络与人们的工作、生活联系越来越紧密,使用搜索引擎从网络中获取需要的信息已经成为了人们的一种习惯。但随着信息量的增大和行为方式的增多,传统的搜索模式逐渐暴露出许多问题,如:忠实表达问题和机械式匹配问题等。造成这些问题的本质原因是传统搜索引擎不能对用户输入的关健字进行词意分析和扩展,缺乏知识处理能力和理解能力。基于本体的智能搜索模型ISMBDI利用语义Web和本体的相关理论技术,把信息检索从基于关键词层面提高到了基于知识(或概念)层面,有效地解决了上述问题,但ISMBDI模型存在着用户查询界面不够友好、查询结果的处理方式不够人性化、查询效率较低等不足。本文针对ISMBDI模型中存在的问题,以提高系统性能和实用性、使其能够成为适于语义Web上信息共享的公共应用系统模型为目的,利用语义Web、本体和缓存等理论技术进行了相关方面的优化研究。研究内容包括基于概念的用户查询界面的优化、查询结果处理方式的优化和查询处理过程及算法的优化等几个方面。基于统一语义及用户界面友好性的考虑,针对ISMBDI模型中用户查询界面的缺点,设计了一种新的基于概念的用户查询界面。该界面综合了传统查询界面模式的优点和ISMBDI模型中用户查询界面的长处,既缩短了用户建立查询请求的时间,减轻了用户负担,又保证了语义的统一性。在深入分析了ISMBDI模型查询处理过程的基础上,提出了一个查询结果处理方式的优化策略。该策略有效地解决了ISMBDI系统在无百分之百匹配结果时出现的零结果问题,提高了系统的可用性。同时,为了实现该优化策略,提出了一种基于本体的查询请求与查询结果相似度的计算方法。该方法通过匹配成功的模式路径数目与查询请求所包含的模式路径总数之间的运算,为用户提供了查询结果与查询请求相似程度的参考值。为了减轻网络负载、减少系统的响应时间,建立了ISMBDI模型的缓存机制,并提出了一种新的缓存置换策略LRAFU。该策略综合了经典缓存置换算法LRU(最近最少使用)和LFU(最低使用频度)的优点,既避免了缓存污染问题,又适合ISMBDI模型的特点,保证了较高的缓存命中率和利用率。根据查询结果处理方式的优化策略和利用缓存中历史查询回答当前查询的思想,对ISMBDI模型中的关键算法——查询计划生成算法Qplan及其优化算法Qplan_opt进行了改进,使得改进后的算法Qplan_imp具有更加丰富的功能和更快的运算速度。在缓存机制的基础上,提出了一个快速检索机制。该机制充分利用缓存中的历史查询记录,以查全率为代价,极大地缩短了查询时间,提高了查询效率,为查全率要求不高的查询请求提供了一个快速通道。最后,我们对查询处理的关键算法Qplan、原优化算法Qplan opt、改进算法Qplan_imp、快速检索算法Qplan_quick以及缓存置换算法LRAFU进行了实验和分析,验证了本文对ISMBDI系统性能的优化效果。
论文目录
摘要ABSTRACT第一章 绪论1.1 论文研究的背景、目的和意义1.1.1 论文研究的背景1.1.2 论文研究的目的和意义1.2 语义Web和智能搜索研究现状概述1.2.1 语义Web和智能搜索国外研究现状1.2.2 语义Web和智能搜索国内研究现状1.3 论文研究的内容1.4 论文的组织结构第二章 语义Web、本体、语义智能搜索和ISMBDI模型2.1 语义Web2.1.1 语义Web的体系结构2.1.2 语义Web的关键技术2.1.2.1 XML2.1.2.2 RDF和RDFS2.2 本体(Ontology)2.2.1 本体的概念2.2.2 本体的重要性2.2.3 本体的建模元语2.2.4 本体的建立2.2.5 本体的描述语言2.3 语义智能搜索2.3.1 基于概念的语义智能搜索的概述2.3.2 基于概念的语义智能搜索的技术实现2.4 基于本体的智能搜索引擎模型ISMBDI2.5 本章小结第三章 基于本体的智能搜索模型ISMBDI的优化3.1 ISMBDI模型优化的必要性3.1.1 搜索引擎性能指标的衡量3.1.2 ISMBDI模型优化的意义3.2 用户查询界面的优化3.2.1 ISMBDI模型中用户查询界面的不足3.2.2 用户查询界面的优化3.3 查询结果处理方式的优化3.3.1 ISMBDI模型中查询结果处理方式的不足3.3.2 查询结果处理方式的优化策略3.3.3 基于本体的匹配度计算3.4 查询过程的优化——设置缓存3.4.1 搜索引擎设置缓存的依据3.4.1.1 缓存机制在搜索引擎中的作用3.4.1.2 用户搜索行为的分析3.4.2 ISMBDI模型的缓存机制3.4.2.1 制定缓存置换算法的必要性3.4.2.2 常用缓存置换算法的分析和比较3.4.2.3 ISMBDI模型缓存的置换算法——LRAFU3.4.2.4 ISMBDI模型缓存的存储结构及其特点3.5 ISMBDI模型关键查询算法的优化3.6 基于缓存的快速检索机制3.6.1 建立基于缓存的快速检索机制的依据3.6.2 基于缓存的查询映射与拆分3.6.3 基于缓存的查询计划生成策略3.6.4 基于缓存的快速检索机制的关键算法3.6.4.1 基于缓存的查询映射算法3.6.4.2 基于缓存的查询后缀生成算法3.6.4.3 基于缓存的查询计划生成算法3.7 本章小结第四章 算法的运行实验与性能分析4.1 实验环境4.2 数据准备4.2.1 映射规则库的建立4.2.2 缓存置换算法测试数据的准备4.3 实验内容与实验结果4.3.1 四种查询计划生成算法性能测试的实验4.3.1.1 四种查询计划生成算法性能测试的实验内容4.3.1.2 四种查询计划生成算法性能测试的实验结果4.3.2 ISMBDI模型缓存性能测试的实验4.3.2.1 衡量ISMBDI系统缓存性能的重要指标4.3.2.2 ISMBDI模型缓存性能测试的实验内容和结果4.4 本章小结第五章 总结与展望5.1 论文工作总结5.2 进一步的研究工作参考文献致谢攻读学位期间参与的科研项目攻读学位期间发表和录用的学术论文
相关论文文献
标签:语义论文; 本体论文; 智能搜索论文; 用户查询界面论文; 查询处理论文; 缓存论文;