基于本体的信息过滤研究与实现

基于本体的信息过滤研究与实现

论文摘要

当今,网络上蕴涵着海量的信息,面对汪洋大海的信息,人们往往感到束手无策,产生垃圾信息的机会越来越多。然而传统的过滤系统,一般都是基于关键字匹配,没有语义的扩展,这样很多我们需要的结果都被过滤掉。如何根据需要对这些信息进行自动分类过滤,就成为信息技术领域的热门问题。本文充分利用本体论和语义Web的相关理论技术,将本体论语义模型应用到信息过滤领域,最终实现了一个基于本体的信息过滤系统。研究的内容有领域本体的建立、存储、读取。文本特征向量的生成、匹配向量过滤算法等几个方面。基于本体的过滤,将语义关系融入到系统,提高了过滤效果。本系统使用JAVA语言、Jena、Mysql数据库、Protege工具来设计显性类算法、显性类实例算法、隐性类、隐性类实例算法。最重要的是提出了一种基于关键字向量分散、融合技术。由于单个信息或者一个句子的查询匹配,会与各个领域的信息资源库进行比较。这样消耗了大量的查询时间,反而不能达到我们的要求。因此对各种信息的分散、融合显得尤为重要。本文提出的策略就是把源文档与领域本体融合,而对于源文档关键字特征提取采用分散。提高了过滤系统的准确率、查全率。本文研究的基于本体的信息过滤系统。主要包括:文档预处理模块、特征向量生成模块、文档特征向量提取模块、匹配模块、因子估算模块。该系统对模型中提出的策略和方法进行模块化和层次化,遵循语义Web的分层结构,为语义Web研究人员,商业团体提供了可借鉴的解决方案。最后,我们对过滤的关键算法进行了实验,在f=0.7的情况下,准确率为97.9%,召回率为96%。通过对实验数据结果的分析,表明本文的想法是正确和可行的。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究动态
  • 1.2.1 国际研究动态
  • 1.2.2 国内研究动态
  • 1.3 本文的主要工作
  • 1.4 本文的结构组织
  • 第二章 信息过滤及本体论概述
  • 2.1 信息过滤与信息检索的区别
  • 2.2 信息过滤的特点
  • 2.3 信息过滤的分类
  • 2.4 信息过滤的模型
  • 2.5 基于本体信息过滤应用信息检索优势
  • 2.6 本体论概述
  • 2.6.1 本体论定义
  • 2.6.2 本体论的建模原语
  • 2.6.3 本体论的分类
  • 2.6.4 本体论构造规则
  • 2.6.5 OWL语言
  • 2.6.6 本体应用开发工具Jena
  • 第三章 信息过滤的性能评测标准
  • 3.1 信息过滤的关键任务
  • 3.1.1 命名实体识别
  • 3.1.2 句法分析
  • 3.1.3 篇章分析与推理
  • 3.2 信息过滤系统的流程结构
  • 3.3 信息过滤系统性能的评估
  • 第四章 基于本体论的信息过滤技术研究
  • 4.1 模型系统介绍
  • 4.2 模型系统框架
  • 4.3 用户界面模块设计
  • 4.4 分词算法设计
  • 4.4.1 机械分词方法
  • 4.4.2 基于规则的分词算法
  • 4.4.3 基于统计的分词算法
  • 4.4.4 统计和规则相结合的方法
  • 4.5 推理部分设计
  • 第五章 信息过滤系统设计与实现
  • 5.1 语义信息库的建立
  • 5.1.1 领域本体的分析设计与建立
  • 5.1.2 关键词词典的设计
  • 5.2 OWL本体的解析
  • 5.2.1 本体的读取
  • 5.2.2 本体的结构化存储设计
  • 5.3 文本预处理的实现
  • 5.4 基于本体的文本信息过滤算法设计
  • 5.4.1 显性类和隐性类算法设计
  • 5.4.2 文本词频统计
  • 5.4.3 文本特征向量与本体融合
  • 5.4.4 向量匹配
  • 5.4.5 因子估算模块
  • 5.4.6 本体信息过滤结果显示
  • 5.4.7 过滤结果性能分析
  • 第六章 结论
  • 参考文献
  • 在学研究成果
  • 致谢
  • 相关论文文献

    • [1].《本体二》[J]. 美苑 2015(S1)
    • [2].渺茫的本体[J]. 中国诗歌 2018(03)
    • [3].虫梦[J]. 意林(少年版) 2010(08)
    • [4].基于程序语义的本体表示方法[J]. 信息系统工程 2017(08)
    • [5].本体评估方法研究综述[J]. 计算机应用研究 2015(03)
    • [6].基于测试用例的应用本体需求验证方法研究[J]. 图书与情报 2013(01)
    • [7].本体演化管理的方法和关键技术研究进展[J]. 图书情报工作 2011(14)
    • [8].工业4.0本体标准及其场景[J]. 国外社会科学前沿 2020(04)
    • [9].基于图数据库的本体查询与推理[J]. 机电产品开发与创新 2019(01)
    • [10].本体对齐技术概述及其在中医领域的应用探讨[J]. 世界科学技术-中医药现代化 2017(01)
    • [11].二人转艺术本体溯源[J]. 剧作家 2010(01)
    • [12].数据本体的概念及意义解析[J]. 岭南学刊 2020(06)
    • [13].中国哲学的“本体”概念与“本体论”[J]. 哲学研究 2010(09)
    • [14].基于群体行为的协同构建本体可信度研究[J]. 情报杂志 2015(06)
    • [15].关注语文本体 提升核心素养[J]. 小学教学参考 2018(34)
    • [16].基于本体的高校图书馆知识地图研究[J]. 图书馆学研究 2012(17)
    • [17].领域本体的构建方法研究[J]. 图书与情报 2011(01)
    • [18].基于描述逻辑的本体进化框架[J]. 计算机工程 2010(13)
    • [19].近两年来国外有关本体基本问题的主要研究述评[J]. 图书馆建设 2008(08)
    • [20].本体的追问和本体的内容[J]. 内蒙古社会科学(汉文版) 2008(05)
    • [21].回归本体 激浊扬清——书法批评的历史回顾与反思[J]. 中国书法 2019(12)
    • [22].人类本体观的历史与价值审视[J]. 阅江学刊 2019(05)
    • [23].广益[J]. 上海艺术评论 2017(03)
    • [24].本体评估研究进展[J]. 情报学报 2016(07)
    • [25].“诗意”之“静”与“美感”之“动”的辩证体现——《形上本体诗学》之“客观诗本体”诗学原理浅析[J]. 河南师范大学学报(哲学社会科学版) 2016(04)
    • [26].基于本体论的大学本体的探究[J]. 现代教育管理 2016(09)
    • [27].客体、主体与道体——论本体的形态[J]. 哲学研究 2013(04)
    • [28].生物医学本体工程进展[J]. 中国数字医学 2012(11)
    • [29].中国哲学中的本体之“诗”[J]. 西北人文科学评论 2009(00)
    • [30].本体构建研究综述[J]. 现代计算机(专业版) 2012(14)

    标签:;  ;  ;  ;  

    基于本体的信息过滤研究与实现
    下载Doc文档

    猜你喜欢