论文摘要
互联网技术的飞速发展使网络信息的价值得到提升。信息检索技术可以帮助人们从互联网世界获取信息,因而倍受青睐。网站分析技术帮助人们更快地检索信息。目前信息检索技术大多从网页角度研究网络信息,本文从网站角度分析网络信息的特点,提出从维度的视角考虑分类、以维度的组合去定位网站类型的分类方法。本文将网站分析分成两个阶段。前一阶段负责本体的建设和维护工作,为后一阶段做好准备。在知识工程方法学的指导下,利用从领域叙词表中人工提取的专业术语进行了构建领域本体的实验并调整了领域本体的结构。之后,重点建设领域本体中的组织机构类。通过向本体中添加实例使组织机构类更加充实,并使用本体对实例的网站进行语义标注,从而获取到高等院校类、企业集团类、科研机构类网站的导航条模板。后一阶段较为详细地分析了多种导航条的样式及其在源文件中的实现方法,进而采用规则的方法实现自动提取导航条及其链接。随后,使用向量空间模型进行模板匹配,对给定的网站自动提取导航条信息之后,将其与模板进行匹配,从而判断网站的主题类型,并可根据模板的先验信息给出所需信息可能存在的网页的链接提示。总之,本文尝试了一种新的分类网站和检索信息的方法,并给出了实验。实验结果表明,此方法具有一定的可行性。
论文目录
摘要Abstract第1章 引言1.1 研究背景介绍1.2 课题的提出及研究意义1.3 国内外相关研究概况1.3.1 语义网和本体技术1.3.2 分类法和分类技术1.4 论文的结构安排第2章 相关研究2.1 本体技术2.1.1 本体的起源及发展2.1.2 本体建设的方法论2.2 分类法2.2.1 图书分类法2.2.2 网站分类情况2.3 网络信息的特点2.3.1 从网页的角度看网络信息的特点2.3.2 从网站的角度看网络信息的特点2.4 网站分析的难点2.5 小结第3章 网站分类法3.1 分类的原因3.1.1 《中图法》的局限性3.1.2 现有网站分类的不足3.2 分类的特点和原则3.2.1 分类的特点3.2.2 分类的原则3.3 体系结构3.3.1 领域维分类3.3.2 主题维分类3.3.3 属性维分类3.4 类目的编号说明3.5 小结第4章 基于本体的网站分析研究4.1 网站分析的前过程4.1.1 本体建设过程4.1.2 组织机构类的建设4.1.3 导航条模板的建设4.2 网站分析的后过程4.2.1 网站分析模块4.2.2 模板匹配模块4.3 小结第5章 实验与结果分析5.1 实验结果评价标准5.2 导航条及链接提取实验5.3 网站类型判定实验5.4 导航定位的实验系统5.4.1 实验系统的框架5.4.2 实验系统的界面5.5 实验总结结论附录Ⅰ中国图书馆分类法附录Ⅱ杜威十进制分类法附录Ⅲ网站分类方法附录Ⅳ中国航空组织机构列表参考文献致谢攻读硕士学位期间发表(含录用)的学术论文
相关论文文献
标签:网络信息分类论文; 网站分类论文; 网站分析论文; 本体技术论文; 导航条模板论文;