基于SOA的网络信息资源采集系统的研究与实现

基于SOA的网络信息资源采集系统的研究与实现

论文摘要

互联网是当今世界上最大的信息库和传播信息的最主要渠道,但是由于信息数据量巨大、整合程度低等特点,限制了对其蕴涵价值的挖掘,如何高效地采集有价值的网络信息资源,成为当前研究的热点。针对采集系统中的难点,在对本体等相关技术深入研究的基础上,本文提出了基于目录树的网络资源采集算法与基于本体和可视化规则的抽取模型,结合网络科技资源应用集成环境建设项目的技术方案和需求说明,设计并实现了基于SOA的网络信息资源采集系统,为获取网络信息资源提供了一个可行的方案。通过实际项目的应用,验证了系统的可行性和高效性。

论文目录

  • 中文摘要
  • 英文摘要
  • 第一章 引言
  • 1.1 研究背景及意义
  • 1.2 发展现状
  • 1.3 主要研究内容
  • 1.4 本文的组织结构
  • 第二章 系统架构设计
  • 2.1 面向服务的体系结构
  • 2.2 面向服务的采集架构设计与分析
  • 2.2.1 采集策略配置
  • 2.2.2 采集算法研究
  • 2.2.3 正文抽取模型研究
  • 2.2.4 网页查重处理
  • 2.3 主要功能模块关系说明
  • 2.4 小结
  • 第三章 基于目录树的采集算法研究
  • 3.1 目录树采集算法的提出
  • 3.2 目录树采集算法设计与分析
  • 3.2.1 采集算法优劣的评价标准
  • 3.2.2 目录树采集算法的结构
  • 3.2.3 目录链接的提取
  • 3.2.4 有效目录链接的识别
  • 3.2.5 有效节点链接的提取
  • 3.3 目录树采集算法验证
  • 3.4 小结
  • 第四章 基于本体和可视化规则的抽取模型研究
  • 4.1 抽取模型结构
  • 4.2 基于领域本体的抽取规则
  • 4.2.1 领域本体分析
  • 4.2.2 领域本体库的建立
  • 4.2.3 基于领域本体的抽取
  • 4.3 可视化抽取规则
  • 4.3.1 可视化抽取规则
  • 4.3.2 可视化抽取规则分析
  • 4.3.3 可视化抽取规则实现
  • 4.4 抽取模型的实现
  • 4.4.1 本体与可视化规则的结合
  • 4.4.2 模型中定义的抽取规则
  • 4.4.3 模型验证
  • 4.5 小结
  • 第五章 系统实现与应用
  • 5.1 应用项目简介
  • 5.2 系统实现
  • 5.2.1 系统结构设计
  • 5.2.2 系统结构分解
  • 5.2.3 数据库结构设计
  • 5.2.4 系统安全性设计
  • 5.3 系统应用
  • 第六章 总结与展望
  • 6.1 本文的工作总结
  • 6.2 下一步的工作
  • 参考文献
  • 致谢
  • 在学期间发表的学术论文和参加科研情况
  • 相关论文文献

    • [1].浅析大数据时代的电子政务信息资源采集[J]. 档案管理 2015(03)
    • [2].循证信息资源采集[J]. 情报探索 2009(03)
    • [3].日本国立国会图书馆网络信息资源采集保存项目介绍研究[J]. 图书馆杂志 2014(03)
    • [4].企业信息资源采集的原则、途径和策略[J]. 情报探索 2011(09)
    • [5].数字出版环境下的信息资源采集策略研究[J]. 图书馆理论与实践 2010(04)
    • [6].网络信息资源采集与保存策略分析[J]. 国家图书馆学刊 2010(04)
    • [7].国外网络信息资源采集研究及其启示[J]. 图书情报论坛 2008(04)
    • [8].国外网络信息资源采集对党校图书馆的启示[J]. 图书情报论坛 2009(04)
    • [9].初探信息资源采集过程中的采集策略[J]. 信息系统工程 2014(04)
    • [10].基于开源软件搭建网络信息资源采集与保存平台[J]. 现代图书情报技术 2009(Z1)
    • [11].国外网络信息资源采集研究及其启示[J]. 科技情报开发与经济 2008(31)
    • [12].国内外网上信息资源采集归档策略对比性研究[J]. 开封教育学院学报 2013(07)
    • [13].高校图书馆网络信息资源采集策略研究[J]. 曲靖师范学院学报 2008(03)
    • [14].英国网络信息资源采集对我国的借鉴和启示[J]. 兰台内外 2014(03)
    • [15].高校图书馆采集网络信息资源的质量评价标准[J]. 贵州师范学院学报 2011(07)
    • [16].数字时代公共图书馆信息资源采集的方式与特点[J]. 黑龙江档案 2013(04)
    • [17].浅谈图书馆数字信息资源采集的原则、途径和方法[J]. 时代金融 2010(05)
    • [18].基于数据魔方的异构档案信息资源采集方法分析[J]. 浙江档案 2018(08)
    • [19].浅析“数字图书馆”的知识产权问题[J]. 四川经济管理学院学报 2009(01)
    • [20].基于政府决策的政务信息采集方法应用研究[J]. 电子政务 2009(Z1)
    • [21].树立知识服务新理念 打造一流报业图书馆[J]. 新闻采编 2010(04)
    • [22].电子政务环境下政府信息资源的形成及采集研究[J]. 档案学通讯 2011(06)
    • [23].互联网军事医学信息资源采集与鉴选策略研究[J]. 中华医学图书情报杂志 2018(04)
    • [24].“一带一路”战略背景下东盟文献信息资源的采集[J]. 内蒙古科技与经济 2017(07)
    • [25].加强档案信息资源建设的几点建议[J]. 中国管理信息化 2013(13)
    • [26].提升图书馆公共服务水平的创新机制研究[J]. 河南图书馆学刊 2009(02)
    • [27].知识经济下档案服务变革[J]. 兰台世界 2008(23)
    • [28].医学图书馆对信息资源采集的探析[J]. 医学信息 2010(04)
    • [29].PBL对学生影响的探析[J]. 卫生职业教育 2016(02)
    • [30].人大代表关于整合共享社会信息资源的建议[J]. 宁波市人民政府公报 2009(12)

    标签:;  ;  ;  ;  

    基于SOA的网络信息资源采集系统的研究与实现
    下载Doc文档

    猜你喜欢