XML标签语义匹配的研究及应用

XML标签语义匹配的研究及应用

论文摘要

在当今以数据为中心的时代,越来越多的应用需要访问各种异构数据源,特别是对于企业应用来说,这既是企业内部发展的需要,也是企业适应外部环境的需要。XML因其具有自描述性、可扩展性以及开放性等优点已经成为了信息表示和数据交换的主要标准,利用XML文档来存储结构化数据的趋势日渐强烈。因此,如何集成基于XML表示的异构数据源,实现有效的信息查询,成了一个亟待解决的问题。 论文针对目前缺乏对独立XML文档数据集成的研究现状,提出了首先寻求XML文档标签之间的语义匹配,然后根据产生的匹配结果,构建用户自定义的中间模式,为异构数据的集成应用提供统一接口的设计思想。论文在综合分析已有模式匹配方法的基础上,首先研究了XML标签的语义匹配算法,然后在长江电气集团电子商务系统中嵌入了数据集成子系统,结合1:1匹配算法产生的标签对,与用户进行动态交互以构建中间模式,利用对中间模式的操作进行数据的可视化查询,实现了数据访问的“透明性”和数据源的“即插即用”性。 论文的主要贡献点是: 1.自主研究并实现了独立XML文档的标签1:1匹配算法,采用22维特征向量来描述每个标签,并用向量距离来量化标签之间的语义关联度,基于最小向量距离选取文档中匹配的标签对。并利用机器学习模块来提高算法的匹配精度,又以长江电气集团两个营销分公司的客户信息作为实验数据,验证了1:1匹配算法的有效性,实验证明:使用机器学习模块后的匹配精度比未使用时提高了8%。 2.基于关系模式复杂匹配方法COMAP的思想,提出了一种自底向上的XML标签的复杂匹配方法。对于叶子标签,针对其数据中所含信息类型的不同,设计不同的搜索器并行查找每个标签可能的复杂映射,并在由此产生的候选映射集上定义了最优匹配指标,以此为标准选取标签的最优复杂匹配。

论文目录

  • 第一章 引言
  • 1.1 问题提出
  • 1.1.1 异构数据源数据集成的迫切性
  • 1.1.2 基于XML表示的异构数据源集成
  • 1.1.3 研究现状
  • 1.1.4 解决思路
  • 1.2 关键技术
  • 1.2.1 文档对象模型DOM
  • 1.2.2 机器学习ML
  • 1.3 本文的研究内容及体系结构
  • 1.3.1 开发背景
  • 1.3.2 研究内容
  • 1.3.3 论文体系结构
  • 第二章 模式匹配方法
  • 2.1 问题定义
  • 2.2 模式匹配的应用领域
  • 2.3 模式匹配方法分类
  • 2.3.1 模式级匹配
  • 2.3.2 实例级方法
  • 2.3.3 组合不同匹配程序
  • 2.4 小结
  • 第三章 XML标签1:1匹配算法的研究和实现
  • 3.1 问题定义
  • 3.1.1 语义对应
  • 3.1.2 形式化定义
  • 3.2 算法前提与基本思想
  • 3.2.1 前提假设
  • 3.2.2 算法思想与设计流程
  • 3.3 算法模块分析
  • 3.3.1 相关概念
  • 3.3.2 数据预处理
  • 3.3.3 约束分析模块
  • 3.3.4 机器学习模块
  • 3.4 数值实验
  • 3.4.1 数据领域
  • 3.4.2 数据预处理
  • 3.4.3 匹配结果及比较
  • 3.5 XML标签1:1匹配算法小结
  • 第四章 XML标签复杂匹配的研究
  • 4.1 问题定义
  • 4.2 关系模式复杂匹配方法COMAP
  • 4.2.1 基本思想
  • 4.2.2 变换至XML标签的复杂匹配
  • 4.3 1:n匹配
  • 4.3.1 产生候选映射
  • 4.3.2 产生最优匹配
  • 4.4 m:n匹配
  • 4.5 XML标签复杂匹配方法小结
  • 第五章 长江电气集团数据集成子系统
  • 5.1 系统体系结构
  • 5.2 系统运行
  • 5.2.1 数据源注册
  • 5.2.2 文档结构查看
  • 5.2.3 语义匹配
  • 5.2.4 可视化查询
  • 5.3 系统特点
  • 第六章 回顾与展望
  • 6.1 总结
  • 6.2 进一步的工作
  • 参考文献
  • 致谢
  • 硕士期间发表论文
  • 相关论文文献

    • [1].基于XML的异构数据库信息交互机制的实现[J]. 物联网技术 2019(12)
    • [2].新闻评论类公众号XML内容分发的发展策略研究——基于十家新闻评论微信公众号的实证考察[J]. 出版广角 2020(10)
    • [3].基于FLASH与XML的在线考试系统的设计与实现[J]. 软件导刊(教育技术) 2016(12)
    • [4].密码协议XML描述方法研究[J]. 信息工程大学学报 2016(06)
    • [5].XML在信息系统中的应用[J]. 电脑编程技巧与维护 2017(04)
    • [6].基于XML的数据中心网络统一配置方法[J]. 自动化与仪器仪表 2017(02)
    • [7].基于伪反馈的有效XML查询扩展[J]. 计算机科学与探索 2016(12)
    • [8].基于XML的电子病历隐私数据脱敏技术的研究与设计[J]. 信息技术与信息化 2017(03)
    • [9].基于XML的电子书自排版系统的实现[J]. 出版科学 2017(04)
    • [10].基于XML配置管理的数字多用表检定软件设计与实现[J]. 中国管理信息化 2017(08)
    • [11].基于XML地图符号表达的研究[J]. 测绘标准化 2016(02)
    • [12].XML技术在社区医疗服务系统中的应用与研究[J]. 数字技术与应用 2016(08)
    • [13].基于XML的工作流引擎的设计与实现[J]. 科技风 2014(17)
    • [14].关系模式到XML模式映射模型的建立与实现[J]. 电子制作 2014(20)
    • [15].基于推理树的XML推理控制研究[J]. 通信技术 2015(02)
    • [16].基于XML的工作流模型挖掘[J]. 计算机光盘软件与应用 2014(21)
    • [17].基于XML路径表达式优化及其查询和过滤计算方法研究[J]. 信阳师范学院学报(自然科学版) 2015(04)
    • [18].基于XML的公交查询系统设计[J]. 科教文汇(下旬刊) 2012(07)
    • [19].XML技术的房地产估价数据标准研究[J]. 中国房地产 2013(24)
    • [20].探究XML在影视后期剪辑中的应用[J]. 中国传媒科技 2020(02)
    • [21].基于模型检查的XML树模式优化动作生成[J]. 计算机应用与软件 2017(03)
    • [22].XML与关系数据库之间的转换[J]. 教育教学论坛 2017(18)
    • [23].XML中基于聚类的相似度改进算法[J]. 计算机与数字工程 2015(12)
    • [24].以目标节点为导向的XML关键词查询和排序[J]. 计算机应用与软件 2016(04)
    • [25].一种基于XML的工作流引擎设计和实现[J]. 电脑编程技巧与维护 2016(16)
    • [26].建设基于XML技术电子病历系统的核心价值[J]. 中国数字医学 2009(02)
    • [27].基于XML的结构化电子病历临床诊疗数据库构建[J]. 中国数字医学 2012(05)
    • [28].基于XML的名老中医医案结构化标引系统[J]. 中国数字医学 2013(07)
    • [29].基于XML-关系映射数据访问层的设计与实现[J]. 安徽广播电视大学学报 2015(02)
    • [30].XML安全技术在高校教务管理系统的应用研究[J]. 河北农业大学学报(农林教育版) 2015(03)

    标签:;  ;  ;  ;  ;  ;  

    XML标签语义匹配的研究及应用
    下载Doc文档

    猜你喜欢