基于XML搜索引擎的研究

基于XML搜索引擎的研究

论文摘要

现有的搜索引擎多数是针对静态HTML(Hyper Text Markup Language)而设计的,HTML只是一种简单的显示语言,无法对检索信息做精确定位,从而大大限制了搜索引擎的查准率。目前,互联网上大量的信息开始采用XML(eXtensible Markup Language)语言来描述、存储和交换。XML标记描述了内容的含义,搜索引擎可以依靠标记和内容之间的依存关系,准确找到信息,从而大大减小搜索范围,提高检索精度。本文介绍了XML和搜索引擎的相关理论知识,并对XML查询语言XQuery的发展进行了回顾,深入研究了查询处理的方法,分析比较了各种算法的优缺点。在此基础上,本文提出了一个基于XML搜索引擎的模型,介绍了各个模块的设计思想,并实现了部分模块。对查询处理方法中查询表达式的分解及连接算法进行了优化。本文介绍的分解合并方法,在处理有规则路径表示的XML数据的查询时,与传统处理方法相比,效率有很大的提高;在将动态规划算法用于中间结果集合的合并处理后,又在很大程度上加快了查询的处理速度,提高了查询效率。

论文目录

  • 提要
  • 第一章 绪论
  • 1.1 选题的意义
  • 1.2 XML 搜索引擎的研究现状
  • 1.3 论文的主要研究内容和结构安排
  • 第二章 相关知识研究
  • 2.1 XML
  • 2.1.1 XML 简介
  • 2.1.2 XML 的特点
  • 2.1.3 XML 的结构
  • 2.1.4 XML 文档解析
  • 2.2 搜索引擎
  • 2.2.1 搜索引擎概述
  • 2.2.2 搜索引擎分类
  • 2.2.3 搜索引擎的原理
  • 2.2.4 搜索引擎主要技术
  • 2.2.5 搜索引擎发展方向
  • 第三章 基于XML 的搜索引擎
  • 3.1 传统搜索引擎的不足
  • 3.2 XML 搜索引擎的优点
  • 3.3 设计思想及模型
  • 3.4 各模块的具体实现
  • 3.4.1 网络蜘蛛模块
  • 3.4.1.1 网络蜘蛛基本原理
  • 3.4.1.2 网站和网络蜘蛛
  • 3.4.2 转换模块
  • 3.4.2.1 转换的基本原理
  • 3.4.2.2 转换的主要方法
  • 3.4.2.3 转换的常见工具
  • 3.4.3 解析模块
  • 3.4.3.1 基本结构
  • 3.4.3.2 XML 节点编码方式
  • 3.4.3.3 具体实现思想
  • 3.4.4 索引模块
  • 3.4.4.1 B+树简介
  • 3.4.4.2 索引的设计
  • 3.4.5 查询模块
  • 第四章 搜索引擎的查询模块
  • 4.1 XML 查询语言的发展
  • 4.2 XQuery 语言
  • 4.3 XML 查询研究现状
  • 4.4 查询处理方法
  • 4.4.1 传统的查询处理方法
  • 4.4.2 查询表达式的分解与连接算法
  • 4.5 XML 数据的查询优化
  • 4.5.1 动态规划算法的基本要素及求解步骤
  • 4.5.2 算法中间结果的连接合并
  • 第五章 结论和工作展望
  • 参考文献
  • 摘要
  • ABSTRACT
  • 致谢
  • 相关论文文献

    • [1].基于XML的异构数据库信息交互机制的实现[J]. 物联网技术 2019(12)
    • [2].新闻评论类公众号XML内容分发的发展策略研究——基于十家新闻评论微信公众号的实证考察[J]. 出版广角 2020(10)
    • [3].基于FLASH与XML的在线考试系统的设计与实现[J]. 软件导刊(教育技术) 2016(12)
    • [4].密码协议XML描述方法研究[J]. 信息工程大学学报 2016(06)
    • [5].XML在信息系统中的应用[J]. 电脑编程技巧与维护 2017(04)
    • [6].基于XML的数据中心网络统一配置方法[J]. 自动化与仪器仪表 2017(02)
    • [7].基于伪反馈的有效XML查询扩展[J]. 计算机科学与探索 2016(12)
    • [8].基于XML的电子病历隐私数据脱敏技术的研究与设计[J]. 信息技术与信息化 2017(03)
    • [9].基于XML的电子书自排版系统的实现[J]. 出版科学 2017(04)
    • [10].基于XML配置管理的数字多用表检定软件设计与实现[J]. 中国管理信息化 2017(08)
    • [11].基于XML地图符号表达的研究[J]. 测绘标准化 2016(02)
    • [12].XML技术在社区医疗服务系统中的应用与研究[J]. 数字技术与应用 2016(08)
    • [13].基于XML的工作流引擎的设计与实现[J]. 科技风 2014(17)
    • [14].关系模式到XML模式映射模型的建立与实现[J]. 电子制作 2014(20)
    • [15].基于推理树的XML推理控制研究[J]. 通信技术 2015(02)
    • [16].基于XML的工作流模型挖掘[J]. 计算机光盘软件与应用 2014(21)
    • [17].基于XML路径表达式优化及其查询和过滤计算方法研究[J]. 信阳师范学院学报(自然科学版) 2015(04)
    • [18].基于XML的公交查询系统设计[J]. 科教文汇(下旬刊) 2012(07)
    • [19].XML技术的房地产估价数据标准研究[J]. 中国房地产 2013(24)
    • [20].《XML技术》线上教学的实践和探索[J]. 科技风 2020(33)
    • [21].探究XML在影视后期剪辑中的应用[J]. 中国传媒科技 2020(02)
    • [22].基于模型检查的XML树模式优化动作生成[J]. 计算机应用与软件 2017(03)
    • [23].XML与关系数据库之间的转换[J]. 教育教学论坛 2017(18)
    • [24].XML中基于聚类的相似度改进算法[J]. 计算机与数字工程 2015(12)
    • [25].以目标节点为导向的XML关键词查询和排序[J]. 计算机应用与软件 2016(04)
    • [26].一种基于XML的工作流引擎设计和实现[J]. 电脑编程技巧与维护 2016(16)
    • [27].建设基于XML技术电子病历系统的核心价值[J]. 中国数字医学 2009(02)
    • [28].基于XML的结构化电子病历临床诊疗数据库构建[J]. 中国数字医学 2012(05)
    • [29].基于XML的名老中医医案结构化标引系统[J]. 中国数字医学 2013(07)
    • [30].基于XML-关系映射数据访问层的设计与实现[J]. 安徽广播电视大学学报 2015(02)

    标签:;  

    基于XML搜索引擎的研究
    下载Doc文档

    猜你喜欢