基于本体的网站分析技术的研究与应用

基于本体的网站分析技术的研究与应用

论文摘要

互联网技术的飞速发展使网络信息的价值得到提升。信息检索技术可以帮助人们从互联网世界获取信息,因而倍受青睐。网站分析技术帮助人们更快地检索信息。目前信息检索技术大多从网页角度研究网络信息,本文从网站角度分析网络信息的特点,提出从维度的视角考虑分类、以维度的组合去定位网站类型的分类方法。本文将网站分析分成两个阶段。前一阶段负责本体的建设和维护工作,为后一阶段做好准备。在知识工程方法学的指导下,利用从领域叙词表中人工提取的专业术语进行了构建领域本体的实验并调整了领域本体的结构。之后,重点建设领域本体中的组织机构类。通过向本体中添加实例使组织机构类更加充实,并使用本体对实例的网站进行语义标注,从而获取到高等院校类、企业集团类、科研机构类网站的导航条模板。后一阶段较为详细地分析了多种导航条的样式及其在源文件中的实现方法,进而采用规则的方法实现自动提取导航条及其链接。随后,使用向量空间模型进行模板匹配,对给定的网站自动提取导航条信息之后,将其与模板进行匹配,从而判断网站的主题类型,并可根据模板的先验信息给出所需信息可能存在的网页的链接提示。总之,本文尝试了一种新的分类网站和检索信息的方法,并给出了实验。实验结果表明,此方法具有一定的可行性。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景介绍
  • 1.2 课题的提出及研究意义
  • 1.3 国内外相关研究概况
  • 1.3.1 语义网和本体技术
  • 1.3.2 分类法和分类技术
  • 1.4 论文的结构安排
  • 第2章 相关研究
  • 2.1 本体技术
  • 2.1.1 本体的起源及发展
  • 2.1.2 本体建设的方法论
  • 2.2 分类法
  • 2.2.1 图书分类法
  • 2.2.2 网站分类情况
  • 2.3 网络信息的特点
  • 2.3.1 从网页的角度看网络信息的特点
  • 2.3.2 从网站的角度看网络信息的特点
  • 2.4 网站分析的难点
  • 2.5 小结
  • 第3章 网站分类法
  • 3.1 分类的原因
  • 3.1.1 《中图法》的局限性
  • 3.1.2 现有网站分类的不足
  • 3.2 分类的特点和原则
  • 3.2.1 分类的特点
  • 3.2.2 分类的原则
  • 3.3 体系结构
  • 3.3.1 领域维分类
  • 3.3.2 主题维分类
  • 3.3.3 属性维分类
  • 3.4 类目的编号说明
  • 3.5 小结
  • 第4章 基于本体的网站分析研究
  • 4.1 网站分析的前过程
  • 4.1.1 本体建设过程
  • 4.1.2 组织机构类的建设
  • 4.1.3 导航条模板的建设
  • 4.2 网站分析的后过程
  • 4.2.1 网站分析模块
  • 4.2.2 模板匹配模块
  • 4.3 小结
  • 第5章 实验与结果分析
  • 5.1 实验结果评价标准
  • 5.2 导航条及链接提取实验
  • 5.3 网站类型判定实验
  • 5.4 导航定位的实验系统
  • 5.4.1 实验系统的框架
  • 5.4.2 实验系统的界面
  • 5.5 实验总结
  • 结论
  • 附录Ⅰ中国图书馆分类法
  • 附录Ⅱ杜威十进制分类法
  • 附录Ⅲ网站分类方法
  • 附录Ⅳ中国航空组织机构列表
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表(含录用)的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于本体的网站分析技术的研究与应用
    下载Doc文档

    猜你喜欢