基于半结构化数据信息检索的研究

基于半结构化数据信息检索的研究

论文摘要

由于半结构数据具有结构复杂、不规范和易变等特点,研究人员普遍采用灵活的图或树形结构来设计半结构数据模型。在数据模型的基础上,研究人员又提出了若干半结构数据的查询语言。图形的半结构数据模型具有很强的表达能力,能够灵活的表示网络上各种格式的数据,但是图形模型无法对数据种不同程度的结构进行明确的描述和概括,数据所具有的结构完全隐含在数据表示当中,在描述结构规则性较高的数据时存在大量的模式信息冗余,数据的处理效率比较低。 本文试图利用半结构数据中的规则结构来解决上述问题。从实际的半结构数据出发,本文设计了描述数据结构规则性的方法,并根据半结构数据的数据模式将半结构数据转化为关系数据,提高半结构数据处理的效率。本文提出了关系和图数据相结合的半结构数据存储模型,以及根据数据所具有的结构规则性,重新组织和存储数据的实际方法。其次,本文给出了将半结构查询转化为关系运算表达式的算法,提出了利用关系查询执行技术求解半结构数据查询的思路。 另外,本文结合当前搜索引擎的不足之处,提出了基于站点的分布式检索结构;最后,本文对文本分类的算法进行了研究,在分析、比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种给合评估函数的TEF-WA权重调整技术,设计了一种新的权重函数,将特征评估函数蕴含到权值函数,按照特征对文本分类的辨别能力调整其在分类器中的贡献。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 引言
  • 1.1 课题的研究背景
  • 1.2 目前的研究现状以及课题的研究内容
  • 1.2.1 半结构数据的主要特点
  • 1.2.2 半结构数据的相关研究问题
  • 1.2.3 搜索引擎的相关研究问题
  • 1.3 论文的结构
  • 第二章 半结构数据管理的图形方法与结构方法
  • 2.1 半结构数据的模型
  • 2.1.1 模型的选择
  • 2.1.2 边标记图模型
  • 2.2 半结构数据的查询语言
  • 2.2.1 半结构查询语言的设计要求
  • 2.2.2 半结构查询语言的设计思路
  • 2.3 半结构数据管理的结构方法
  • 2.3.1 图形方法的局限性
  • 2.3.2 半结构数据模式的研究现状
  • 2.3.3 结构方法的研究内容和特点
  • 第三章 半结构数据的存储模型以及查询执行
  • 3.1 存储模型
  • 3.2 存储模型的生成
  • 3.2.1 数据节点与模式节点的对应关系
  • 3.2.2 关系数据的生成
  • 3.2.3 存储模型的生成算法
  • 3.3 存储模型上采用的查询执行方法
  • 第四章 基于站点的分布式检索结构的研究
  • 4.1 问题的提出
  • 4.2 问题的分析
  • 4.3 解决的方法:基于站点的分布式检索结构
  • 第五章 文本分类技术研究
  • 5.1 引言
  • 5.2 分类算法
  • 5.2.1 几何分类
  • 5.2.2 朴素贝叶斯分类
  • 5.2.3 k-最近邻参照分类
  • 5.3 文本分类中特征选择存在的问题
  • 5.4 TEF-WA权重调整技术
  • 5.4.1 TEF-WA权重调整技术的基本思想
  • 5.4.2 各种评估函数
  • 5.4.3 实验结果与分析
  • 5.5 结论
  • 第六章 结论
  • 6.1 论文工作总结
  • 6.2 进一步探讨
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].基于R树的非结构数据索引[J]. 电脑知识与技术 2012(29)
    • [2].图结构数据的隐私保护研究[J]. 信息通信 2020(01)
    • [3].层次结构数据在组合框中树形效果的动态实现[J]. 计算机时代 2012(07)
    • [4].基于TreeGrid控件的树结构数据呈现形式研究[J]. 现代计算机(专业版) 2016(16)
    • [5].利用TreeView实现层次结构数据导航查询[J]. 电脑开发与应用 2012(08)
    • [6].基于r-子团最小覆盖的图结构数据高效关键字搜索(英文)[J]. Frontiers of Information Technology & Electronic Engineering 2020(03)
    • [7].基于层次结构数据的多元线性回归问题分析[J]. 数据采集与处理 2019(05)
    • [8].一种多结构数据的同步拟合方法[J]. 计算机工程与应用 2017(06)
    • [9].基于非结构数据流行学习的碳价格多尺度组合预测[J]. 控制与决策 2019(02)
    • [10].用自定义Treeview控件实现层次结构数据浏览功能[J]. 电脑编程技巧与维护 2010(09)
    • [11].异构PDM环境下基于虚拟PDM的产品结构数据交换方法[J]. 机械科学与技术 2012(08)
    • [12].基于高阶逻辑的复杂结构数据半监督聚类[J]. 计算机科学 2009(09)
    • [13].基于功能的武器装备体系结构描述方法[J]. 系统工程与电子技术 2010(01)
    • [14].基于CADM的C~4ISR体系结构数据完备性验证方法研究[J]. 舰船电子工程 2008(10)
    • [15].CrossFire Beilstein/Gmelin和SciFinder系统中结构数据的比较及检索策略[J]. 情报探索 2008(12)
    • [16].基于高层次结构数据的多水平模型贝叶斯推断及应用[J]. 数理统计与管理 2019(02)
    • [17].中哈贸易现状研究[J]. 合作经济与科技 2014(11)
    • [18].基于DM2的体系结构数据完备性验证方法[J]. 装备学院学报 2012(05)
    • [19].树型层次结构数据中遍历子树结点的方法[J]. 计算机技术与发展 2008(04)
    • [20].关于ERP系统读取组织结构数据响应时间过长的分析与处理[J]. 通讯世界 2016(17)
    • [21].IS恐袭阴云下的西欧[J]. 南风窗 2016(08)
    • [22].关系数据库中对于层次结构数据的处理分析[J]. 电脑知识与技术 2011(28)
    • [23].大数据时代对管理会计的影响及其作用[J]. 企业改革与管理 2015(24)
    • [24].我国对美国市场中药商品贸易出口分析[J]. 中国现代中药 2012(07)
    • [25].新疆网民数据调查与分析[J]. 新疆社会科学 2008(04)
    • [26].深入挖掘数据资源价值[J]. 工商行政管理 2014(22)
    • [27].Hadoop迭代优化技术的研究[J]. 计算机技术与发展 2014(09)
    • [28].我国立体裁剪技术的起源性探究:汉代玉衣结构数据分析[J]. 纺织报告 2016(12)
    • [29].左心耳结构数据测量方法应用于经皮左心耳封堵术的研究进展[J]. 中国介入心脏病学杂志 2016(06)
    • [30].高阶逻辑下知识表示与聚类方法的研究[J]. 计算机应用研究 2010(08)

    标签:;  ;  ;  ;  ;  ;  

    基于半结构化数据信息检索的研究
    下载Doc文档

    猜你喜欢