基于CPN网络的Deep Web集成系统中结果模式语义标注方法

基于CPN网络的Deep Web集成系统中结果模式语义标注方法

论文摘要

随着Internet的普及和快速发展,Web已经成为富含多种信息资源、遍布全球的共享信息仓库,成为人们获取信息的有效手段和重要方式。而Deep Web信息门类齐全、数据量庞大,几乎无所不包,然而面对如此庞大的信息海洋,用户关心的只是其中很小的一部分信息,需要提供有效的搜索引擎或信息集成工具,帮助用户快速、准确地找到他所感兴趣的信息。当前Deep Web中最具代表性的就是电子商务网站,这些网站将自己后台数据库中的相关数据填充到它们的模板页面中,形成了结果页面。通过一定的技术手段,可以将结果页面中用户感兴趣的数据抽取出来。但是存在计算机无法识别抽取出来数据所具有的实际语义信息这个问题。所以需要为抽取出来的数据添加语义标签。为解决Deep Web信息集成中的语义标注问题,本文提出了一种语义标注方法。这种方法具有较高的标注全面性,而标注精度上和当前的主流算法持平。本文首先定义了结果模式概念,讨论了基于结果模式的Deep Web语义标注问题,提出了Deep Web语义标注的评价准则。根据观察大量的结果页面的属性值,提出七个属性值的特征,并根据计算特征的需要,提出了属性值数据类型分类模型,同时讨论了特征向量标准化的必要性。然后,通过样本的学习训练得到CPN网络,并使用CPN网络来完成语义标注。为此,本文研究了结果页面信息的获取技术、结果页面属性值的特征分析提取技术、特征向量标准化技术、使用CPN网络语义标注技术,提出了一个改进的CPN算法,该算法在结果页面的属性值提取、属性值的特征分析与计算、特征向量的标准的基础上,通过样本学习训练建立了CPN网络,然后使用CPN网络对属性值语义标注,能够减少学习时间。针对在实际的处理中会出现学习死循环问题,本文进一步对CPN网络进行了改进,有效的降低了死循环的概率。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 研究内容
  • 1.4 本文的组织结构
  • 第2章 研究基础
  • 2.1 语义标注技术
  • 2.1.1 基于本体的语义标注
  • 2.1.2 基于启发式规则的语义标注
  • 2.2 人工神经网络
  • 2.2.1 自组织特征映射(SOM)
  • 2.2.2 CPN网络
  • 2.3 Deep Web信息集成系统概述
  • 2.4 小结
  • 第3章 基于CPN网络的DEEP WEB集成系统中结果模式语义标注机制
  • 3.1 结果模式的定义
  • 3.1.1 Deep Web结果模式定义
  • 3.1.2 数据类型分类
  • 3.2 Deep Web结果模式语义标注的定义以及评价准则
  • 3.2.1 Deep Web结果模式语义标注的定义
  • 3.2.2 Deep Web结果模式语义标注的评价准则
  • 3.3 基于 CPN网络的Deep Web集成系统中结果模式语义标注机制
  • 3.4 本章小结
  • 第4章 结果页面属性值特征的选取
  • 4.1 结果页面信息获取
  • 4.1.1 正文块的获取
  • 4.1.2 数据项的抽取
  • 4.1.3 属性值的获取
  • 4.2 样本特征的选取
  • 4.2.1 样本数据类型分类
  • 4.2.2 样本特征的选取
  • 4.2.3 样本特征选取算法
  • 4.3 样本特征的标准化
  • 4.4 本章小节
  • 第5章 基于CPN网络的DEEP WEB集成系统中结果模式语义标注
  • 5.1 经典的CPN算法
  • 5.2 改进的CPN算法
  • 5.2.1 Kohonen层的无导师训练学习
  • 5.2.2 Grossberg层的有导师学习
  • 5.2.3 算法效率分析
  • 5.2.4 网络参数的设置
  • 5.2.5 进一步改进CPN算法
  • 5.3 标注算法
  • 5.4 本章小结
  • 第6章 实验结果分析
  • 6.1 实验环境
  • 6.2 实验结果分析
  • 6.2.1 样本数量对语义标注的影响
  • 6.2.2 CPN网络参数对学习的影响
  • 6.2.3 在不同领域的标注情况
  • 6.2.4 同基于本体的标注与基于语义的标注的比较
  • 6.3 本章小结
  • 第7章 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].CPN:一种计算/网络资源联合优化方案探讨[J]. 数据与计算发展前沿 2020(04)
    • [2].基于CPN的联锁进路控制建模及验证[J]. 工业控制计算机 2014(11)
    • [3].资源角度的CPN工作流模型[J]. 福建电脑 2012(11)
    • [4].基于CPN的数据版本控制建模与研究[J]. 物流技术 2012(23)
    • [5].基于云计算的军事通信系统CPN建模与仿真[J]. 计算机仿真 2015(09)
    • [6].基于CPN高铁临时限速数据融合方案验证[J]. 北京交通大学学报 2012(03)
    • [7].基于CPN仿真的复杂装备系统维修性预计方法研究[J]. 工程设计学报 2010(01)
    • [8].基于CPN状态空间的软件场景测试[J]. 计算机应用与软件 2010(09)
    • [9].基于层次赋时CPN的网络系统建模与可生存性优化[J]. 系统仿真学报 2009(19)
    • [10].轮转调度算法中动态时间片的CPN实现[J]. 软件 2020(08)
    • [11].基于CPN飞机超短波电台主最低设备仿真分析[J]. 现代电子技术 2013(06)
    • [12].CPN网络模拟仿人机器人学习推理能力的应用[J]. 重庆理工大学学报(自然科学) 2011(06)
    • [13].基于CPN的维修保障资源配置建模与仿真方法[J]. 兵工自动化 2009(09)
    • [14].面向CPN属性的测试序列的自动生成方法[J]. 科技资讯 2015(14)
    • [15].基于粗糙集-CPN网络的客户价值预测[J]. 统计与决策 2008(05)
    • [16].基于CPN的常规潜艇随艇备件优化研究[J]. 微计算机信息 2010(04)
    • [17].一种层次化的面向对象CPN模型及其应用[J]. 微型电脑应用 2008(11)
    • [18].基于CPN的在轨服务概念建模[J]. 系统仿真学报 2011(S1)
    • [19].基于CPN对传神经网络的防砂方法优选[J]. 中国石油和化工标准与质量 2013(21)
    • [20].基于CPN的求解关键路径的新方法[J]. 计算机系统应用 2013(08)
    • [21].一种改进的基于CPN的密码协议攻击者模型[J]. 内蒙古农业大学学报(自然科学版) 2014(05)
    • [22].基于CPN仿真的排队系统建模及性能分析[J]. 系统仿真学报 2013(02)
    • [23].Minix3访问控制的系统调用的CPN建模与测试[J]. 小型微型计算机系统 2013(12)
    • [24].临床护理路径(CPN)对急性左心衰患者护理质量及预后的影响[J]. 实用临床护理学电子杂志 2020(22)
    • [25].基于CPN的飞机驾驶操纵过程建模及工效分析[J]. 航空计算技术 2017(01)
    • [26].一种基于CPN的BPEL异常处理逻辑的开发方法[J]. 计算机科学 2013(01)
    • [27].基于CPN模型Auction智能合约的形式化验证[J]. 小型微型计算机系统 2020(11)
    • [28].IDEF0与CPN的自动转换方法研究[J]. 计算机与数字工程 2012(04)
    • [29].基于扩展CPN的OWL-S过程语义建模及分析方法研究[J]. 计算机科学 2011(04)
    • [30].CPN在FCM形式化建模与验证中的应用[J]. 计算机仿真 2011(06)

    标签:;  ;  ;  ;  

    基于CPN网络的Deep Web集成系统中结果模式语义标注方法
    下载Doc文档

    猜你喜欢