关系-XML无缝集成数据库系统中关键字查询技术的研究与实现

关系-XML无缝集成数据库系统中关键字查询技术的研究与实现

论文摘要

随着XML逐渐成为数据表示和数据交换的标准,XML在越来越多的领域得到了广泛的应用,XML文档的数量也在逐渐增多,如何从大量的XML文档中搜索出用户满意的结果已经成为数据库领域一个重要的研究方向。本文依托于国家863数据库重大项目“无缝集成的关系-XML双引擎数据库管理系统研制及其示范应用”,设计并实现了XML关键字查询的功能。文中将XML关键字查询分为带有复杂结构和不带有复杂结构的关键字查询。带有复杂结构的关键字查询即为结构查询,它能够精确的表达用户的查询要求,但同时对用户要求很高,要求用户掌握复杂的查询语言,了解XML文档的模式信息,适用于高级程序员或数据库管理员;不带有复杂结构的关键字查询即为关键字查询,它对用户要求低,适合于广大的普通用户,用户只需输入感兴趣的一个或多个关键字,系统就会返回满足用户查询意图的结果。文中首先介绍了关键字查询的设计,包括存储XML文档信息的XmlInfoRelation表的结构,存储索引词及索引词的各种信息的倒排索引和关键字查询及结构查询用到的一些算法。XmlInfoRelation表中存储了XML文档的文本内容和模式信息,是XML文档的另一种表示形式,倒排索引建立在表中的文本列上,在倒排索引中,存储了每个索引词在XML文档中的详细位置信息。在此基础上,提出了一个适合本系统的关键字查询算法CoSQLRXSE,并与ILE算法进行了比较。其次,介绍了关键字查询的具体实现过程。以一个XML关键字查询实例来具体介绍关键字查询具体涉及到的数据结构和算法,接下来对所有的数据结构和算法分为三个方面进行实现方面的介绍,这三个方面包括从倒排索引中或扫描XML文档来提取所需要的查询信息,根据查询条件对提取的信息进行判断,将满足查询条件的XML文档或文档片段返回给用户。最后,本文进行了实验测试与分析。文中采用XMark测试基准对系统中不同规格的XML文档进行关键字查询测试。实验结果表明,本文所设计的XML关键字倒排索引能够显著的加快查找速度,本文提出的算法能够很好的结合系统存储的特点,高效的返回查找结果。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究内容背景
  • 1.2 研究内容的目的和意义
  • 1.3 主要研究内容
  • 1.4 本文的组织结构
  • 第2章 相关研究工作
  • 2.1 XML相关概念及技术
  • 2.1.1 XML简介及标准
  • 2.1.2 Dewey编码
  • 2.2 XML关键字查询相关技术
  • 2.2.1 倒排索引技术
  • 2.2.2 结构查询语言
  • 2.2.3 关键字查询算法
  • 2.3 CoSQLRX数据库管理系统
  • 2.3.1 PostgreSQL系统
  • 2.3.2 CoSQLRX系统
  • 2.4 本章小结
  • 第3章 XML关键字查询处理的设计
  • 3.1 基本思想
  • 3.2 CoSQLRX系统XML关键字索引结构
  • 3.2.1 XmlInfoRelation表结构
  • 3.2.2 倒排索引
  • 3.3 XML关键字查询执行策略
  • 3.3.1 关键字查询
  • 3.3.2 结构查询
  • 3.4 全文检索结果的评分算法
  • 3.5 本章小结
  • 第4章 XML关键字查询处理的实现
  • 4.1 XML关键字查询实例
  • 4.1.1 XML文档及其存储
  • 4.1.2 XML关键字查询实例
  • 4.2 XML关键字查询的处理过程
  • 4.2.1 查询信息的提取
  • 4.2.2 查询条件判断
  • 4.2.3 查询结果的返回
  • 4.3 XML文档索引更新
  • 4.4 本章小结
  • 第5章 实验与性能分析
  • 5.1 实验环境
  • 5.1.1 测试平台
  • 5.1.2 测试数据集
  • 5.2 实验及结果分析
  • 5.2.1 实验设置
  • 5.2.2 索引和扫描
  • 5.2.3 关键字查询算法
  • 5.3 本章小结
  • 第6章 总结与展望
  • 6.1 内容总结
  • 6.2 未来展望
  • 参考文献
  • 致谢
  • 攻读硕士期间参加的项目和申请的专利
  • 相关论文文献

    • [1].基于XML的异构数据库信息交互机制的实现[J]. 物联网技术 2019(12)
    • [2].新闻评论类公众号XML内容分发的发展策略研究——基于十家新闻评论微信公众号的实证考察[J]. 出版广角 2020(10)
    • [3].基于FLASH与XML的在线考试系统的设计与实现[J]. 软件导刊(教育技术) 2016(12)
    • [4].密码协议XML描述方法研究[J]. 信息工程大学学报 2016(06)
    • [5].XML在信息系统中的应用[J]. 电脑编程技巧与维护 2017(04)
    • [6].基于XML的数据中心网络统一配置方法[J]. 自动化与仪器仪表 2017(02)
    • [7].基于伪反馈的有效XML查询扩展[J]. 计算机科学与探索 2016(12)
    • [8].基于XML的电子病历隐私数据脱敏技术的研究与设计[J]. 信息技术与信息化 2017(03)
    • [9].基于XML的电子书自排版系统的实现[J]. 出版科学 2017(04)
    • [10].基于XML配置管理的数字多用表检定软件设计与实现[J]. 中国管理信息化 2017(08)
    • [11].基于XML地图符号表达的研究[J]. 测绘标准化 2016(02)
    • [12].XML技术在社区医疗服务系统中的应用与研究[J]. 数字技术与应用 2016(08)
    • [13].基于XML的工作流引擎的设计与实现[J]. 科技风 2014(17)
    • [14].关系模式到XML模式映射模型的建立与实现[J]. 电子制作 2014(20)
    • [15].基于推理树的XML推理控制研究[J]. 通信技术 2015(02)
    • [16].基于XML的工作流模型挖掘[J]. 计算机光盘软件与应用 2014(21)
    • [17].基于XML路径表达式优化及其查询和过滤计算方法研究[J]. 信阳师范学院学报(自然科学版) 2015(04)
    • [18].基于XML的公交查询系统设计[J]. 科教文汇(下旬刊) 2012(07)
    • [19].XML技术的房地产估价数据标准研究[J]. 中国房地产 2013(24)
    • [20].《XML技术》线上教学的实践和探索[J]. 科技风 2020(33)
    • [21].探究XML在影视后期剪辑中的应用[J]. 中国传媒科技 2020(02)
    • [22].基于模型检查的XML树模式优化动作生成[J]. 计算机应用与软件 2017(03)
    • [23].XML与关系数据库之间的转换[J]. 教育教学论坛 2017(18)
    • [24].XML中基于聚类的相似度改进算法[J]. 计算机与数字工程 2015(12)
    • [25].以目标节点为导向的XML关键词查询和排序[J]. 计算机应用与软件 2016(04)
    • [26].一种基于XML的工作流引擎设计和实现[J]. 电脑编程技巧与维护 2016(16)
    • [27].建设基于XML技术电子病历系统的核心价值[J]. 中国数字医学 2009(02)
    • [28].基于XML的结构化电子病历临床诊疗数据库构建[J]. 中国数字医学 2012(05)
    • [29].基于XML的名老中医医案结构化标引系统[J]. 中国数字医学 2013(07)
    • [30].基于XML-关系映射数据访问层的设计与实现[J]. 安徽广播电视大学学报 2015(02)

    标签:;  ;  ;  

    关系-XML无缝集成数据库系统中关键字查询技术的研究与实现
    下载Doc文档

    猜你喜欢