数字有机体数据库中信息检索研究与实现

数字有机体数据库中信息检索研究与实现

论文摘要

传统上,数据库技术和信息检索技术两者独立发展。数据库技术处理结构化数据,采用结构化查询语言,查询结果是精确的完全的并且被同等对待。信息检索技术处理非结构化数据,采用非结构化查询语言,查询结果不精确不完全,根据相关性进行返回。把信息搜索技术应用到数据库关键词的搜索中提高了数据库系统的易用性,用户无需知道数据的存储结构和SQL语法规则,可以使用简单的关键词自由的检索数据库,挖掘其中的信息和知识,信息资源的利用效率得到很大提高。因此,8010教研室在数字有机体数据库系统基础上,以数据库信息的灵活检索为根本出发点,开发了数据库信息检索系统。信息检索系统可分为预处理阶段和查询阶段。查询阶段首先对用户检索请求进行语法分析,然后通过检索策略获得检索结果。在用户未指定检索关键字所在属性的情况下,检索策略的设计是研究的一个重点,检索结果必须满足完整性和非冗余性。本课题充分分析现有数据库关键字检索系统和MySQL数据库。在数字有机体数据库系统的基础上,设计和实现了基于数字有机体数据库信息检索系统的检索策略。此部分主要分为四个阶段:索引查询、生成数据图、获得结果树和SQL语句的生成、执行。索引查询和生成数据图在同一模块中实现,数据图由关键字所在位置和数据库结构生成,体现了数据库中包含检索关键字的关系以及关系之间的联系。通过采用双层结构,充分利用数据库结构属性和查询类型特点对索引信息进行精炼,减少数据图中无用数据的产生。遍历数据图,可获得所有满足用户请求的子图(结果树)。在结果树生成算法中,在保证结果树完整性的同时,对遍历起始节点的有效选择减少了在遍历时产生的冗余子树。结果树包含检索请求的所有关键字,指明了关系中的选择操作和关系之间的连接条件,通过构造相应的SQL查询语句,最终获得满足检索结果。系统通过模块化和层次化设计使各模块算法具有良好的扩张性,并且采用ODBC接口与数据库服务器进行交互,确保了整个信息检索模块的独立性。最后对系统进行功能和性能测试,指出不同参数对数据库关键字检索的影响。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 研究背景
  • 1.1.1 关系数据库关键字检索
  • 1.1.2 数字有机体数据库
  • 1.2 研究意义和目标
  • 1.3 本文工作
  • 1.4 论文组织
  • 第二章 关系数据库关键字搜索概述
  • 2.1 文本搜索与数据库搜索
  • 2.2 关系数据库关键字检索
  • 2.3 相关数据库关键字搜索系统分析
  • 2.3.1 DBXplorer
  • 2.3.2 BANKS
  • 2.3.3 DISCOVER/IR-Style
  • 2.3.4 ObjectRank
  • 2.3.5 小结
  • 2.4 功能概述
  • 2.4.1 结果排序
  • 2.4.2 执行效率
  • 2.4.3 结果返回
  • 2.4.4 与传统文本/网页搜索区别
  • 2.5 数据库关键字检索小结
  • 第三章 DOSSQL 关键字搜索子系统总体设计
  • 3.1 基本概念
  • 3.2 系统平台
  • 3.3 设计目标
  • 3.4 搜索执行模块
  • 3.4.1 查询阶段
  • 3.4.2 预处理阶段
  • 3.5 本章小结
  • 第四章 IREngine 实现
  • 4.1 IR Engine 介绍
  • 4.1.1 相关定义
  • 4.1.2 模块功能
  • 4.2 模块实现基础
  • 4.3 索引查询
  • ki 信息的处理'>4.3.1 (R|-)ki信息的处理
  • K 的计算'>4.3.2 RK的计算
  • 4.4 数据图设计
  • 4.4.1 数据图简述
  • 4.4.2 数据图结构
  • 4.5 算法描述
  • K 计算算法'>4.5.1 RK计算算法
  • 4.5.2 数据图生成算法
  • 4.6 IR Engine 数据结构
  • 4.6.1 使用的外部类说明
  • 4.6.2 IREngine 类结构
  • 4.7 本章小结
  • 第五章 ResultTree Generator 实现
  • 5.1 引言
  • 5.1.1 结果树特征
  • 5.1.2 结果树算法概述
  • 5.2 结果树问题描述
  • 5.2.1 重复遍历
  • 5.2.2 环形结构
  • max'>5.2.3 结果树最大规模Tmax
  • 5.2.4 结果树特征
  • 5.3 数据图预处理
  • 5.4 结果树生成算法
  • 5.4.1 起始顶点选择
  • 5.4.2 算法数据结构
  • 5.4.3 算法描述
  • 5.4.4 算法分析
  • 5.5 数据结构
  • 5.6 本章小结
  • 第六章 Execution Engine 实现
  • 6.1 查询语句构造
  • 6.1.1 MATCH 语句构造
  • 6.1.2 LIKE 语句构造
  • 6.1.3 连接语句构造
  • 6.1.4 语句构造中的优化
  • 6.2 SQL 语句执行
  • 6.3 结果排序
  • 6.3.1 排序算法基本思想
  • 6.3.2 系统采用的排序算法
  • 6.4 数据结构
  • 6.5 本章小结
  • 第七章 测试
  • 7.1 测试环境
  • 7.2 关键字个数对性能的影响
  • max 对性能的影响'>7.3 结果树最大规模Tmax对性能的影响
  • 7.4 返回结果个数top-k 对性能的影响
  • 7.5 各模块资源消耗对比
  • 7.6 本章小结
  • 第八章 结论
  • 参考文献
  • 致谢
  • 攻硕期间取得的研究成果
  • 相关论文文献

    • [1].基于统计分析的分享型数据库需求无约束估计模型[J]. 淮阴工学院学报 2019(05)
    • [2].基于数据库的网络课题开发策略[J]. 通讯世界 2019(12)
    • [3].基于陕西省地质调查数据库融合理论方法[J]. 陕西地质 2019(02)
    • [4].中国核心期刊(遴选)数据库收录证书[J]. 防护工程 2019(05)
    • [5].面向异地双活系统的数据库改造方法[J]. 微型电脑应用 2020(01)
    • [6].危险化学品数据库的发展现状与展望[J]. 合成材料老化与应用 2020(01)
    • [7].舰船电磁环境数据库的设计与实现[J]. 装备环境工程 2020(03)
    • [8].中国核心期刊(遴选)数据库收录证书[J]. 防护工程 2019(06)
    • [9].欧洲职业培训发展中心启动新职业教育和培训数据库[J]. 世界教育信息 2020(02)
    • [10].大数据思维下数据库教育模式改革探索[J]. 计算机产品与流通 2020(03)
    • [11].数据库的安全重要性以及带来的风险[J]. 计算机产品与流通 2020(04)
    • [12].中国核心期刊(遴选)数据库收录证书[J]. 防护工程 2020(01)
    • [13].政治学跨国比较研究中的数据库及其运用[J]. 信息系统工程 2020(04)
    • [14].关于中国数据库调查方法与资本化核算方法研究[J]. 统计研究 2020(05)
    • [15].实现灾备数据库同步[J]. 网络安全和信息化 2020(01)
    • [16].基于全局目录的集中型数据库分布式加锁仿真[J]. 计算机仿真 2020(04)
    • [17].中国核心期刊(遴选)数据库收录证书[J]. 防护工程 2020(02)
    • [18].医院围术期麻醉专科数据库的建设与思考[J]. 中国卫生信息管理杂志 2020(03)
    • [19].基于分布式的数据库分库与分表策略研究[J]. 电脑知识与技术 2020(14)
    • [20].主报警数据库在报警管理的应用探讨[J]. 当代化工研究 2020(15)
    • [21].最新版《中国评价核数据库》发布[J]. 中国核电 2020(03)
    • [22].数据库的知识产权保护范式研究[J]. 政法学刊 2020(04)
    • [23].中国核心期刊(遴选)数据库收录证书[J]. 防护工程 2020(03)
    • [24].海洋细菌基质辅助激光解吸电离飞行时间质谱鉴定数据库的建立[J]. 解放军医学院学报 2020(07)
    • [25].大数据时代临床数据库在肿瘤研究中的应用[J]. 传染病信息 2020(04)
    • [26].数据库在计算软件开发中的管理分析[J]. 电脑编程技巧与维护 2020(08)
    • [27].基于语义标注的数据库元数据质量评估方法[J]. 计算机产品与流通 2020(11)
    • [28].基于数据库视角下解读大数据的研究进展与趋势[J]. 计算机产品与流通 2020(11)
    • [29].《感染、炎症、修复》杂志检索数据库[J]. 感染、炎症、修复 2018(03)
    • [30].《感染、炎症、修复》杂志检索数据库[J]. 感染、炎症、修复 2018(04)

    标签:;  ;  ;  ;  

    数字有机体数据库中信息检索研究与实现
    下载Doc文档

    猜你喜欢