基于本体的文本信息抽取技术及实现

基于本体的文本信息抽取技术及实现

论文摘要

随着社会的不断进步,网络上的资源越来越丰富,这给人们带来方便的同时也带来了不便,因为人们在大量的信息中快速的找到自己所需要的信息变成了一件很困难的事情。在计算机学科中为了攻克这一难题大家进行了刻苦的专研,就是在这样的情况下产生的信息抽取技术。而基于本体的信息抽取技术现今已经成为信息抽取技术中的研究热点。本文先阐述了信息抽取技术及其产生的背景和发展历史,然后对本体的基本知识进行了研究,在此基础上,本文提出了一种新的基于本体的信息抽取方法,将本体和信息抽取结合起来,即利用本体的规则生成模块,进而生成抽取规则来抽取人们所需要的文本信息。所以利用信息抽取规则来进行信息抽取实际上就是基于本体的信息抽取。本文设计并实现了一个基于高校教师简历本体的信息抽取系统,设计了基于本体的信息抽取系统的总体框架,并详细说明系统中的主要模块的设计和实现,其中包括领域本体的构建、本体解析的过程、web页面的预处理、信息抽取的实现等。本文将无规则的web页面进行预处理后存入到数据库中,用Protégé3.3构建高校教师简历本体,然后将本体进行解析,将解析后的概念、属性等相关信息存储到数据库中。最后,用信息抽取系统来进行抽取,并得出最终抽取的结果。在文章的最后对基于本体的信息抽取系统的实验结果进行了对比分析。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究的背景和意义
  • 1.2 国内外研究现状
  • 1.3 研究的主要内容
  • 第二章 信息抽取系统概述
  • 2.1 信息抽取的含义
  • 2.2 信息抽取的历史和现状
  • 2.3 信息抽取的分类及比较
  • 2.3.1 基于自然语言处理方式的信息抽取
  • 2.3.2 包装器归纳方式的信息抽取
  • 2.3.3 基于HTML 结构的信息抽取
  • 2.3.4 基于XML 结构的信息抽取
  • 2.3.5 基于Web 查询的信息抽取
  • 2.3.6 基于ontology 方式的信息抽取
  • 2.3.7 几种信息抽取方法的比较
  • 2.4 信息抽取系统的衡量指标
  • 第三章 基于本体的信息抽取技术分析
  • 3.1 本体的定义
  • 3.2 Ontology 的基本组成元素
  • 3.3 本体的分类
  • 3.4 本体的构建工具
  • 3.5 基于本体的信息抽取系统概述
  • 3.6 基于本体的信息抽取系统应用实例研究
  • 3.6.1 KEUOA 系统
  • 3.6.2 Artequakt 系统
  • 3.6.3 OFEE 系统
  • 第四章 基于本体的信息抽取系统系统设
  • 4.1 基于本体的信息抽取系统总体结构
  • 4.2 领域本体的构建
  • 4.3 本体解析
  • 4.4 规则生成
  • 4.4.1 JAPE 规则
  • 4.4.2 Lex 规则
  • 4.5 预处理
  • 4.6 信息抽取器的设计
  • 第五章 测试结果对比分析
  • 5.1 实验结果与分析
  • 5.2 总结及展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].信息抽取技术在军事标图系统中的应用[J]. 电子科技 2013(12)
    • [2].技术检测中的信息抽取技术的应用分析[J]. 价值工程 2014(21)
    • [3].信息抽取技术在情报学中的应用分析[J]. 情报理论与实践 2008(05)
    • [4].信息抽取技术在地方社科院网站建设中的应用[J]. 科技资讯 2015(13)
    • [5].信息抽取技术探析[J]. 通化师范学院学报 2008(04)
    • [6].信息抽取技术综述[J]. 福建电脑 2013(05)
    • [7].信息抽取技术及其在数字图书馆中的应用前景[J]. 中国科技资源导刊 2008(02)
    • [8].基于信息抽取技术的中大布市导购助手的设计与实现[J]. 广东轻工职业技术学院学报 2015(03)
    • [9].从ACE会议看信息抽取技术的发展趋势[J]. 现代图书情报技术 2008(03)
    • [10].信息抽取技术研究与探讨[J]. 福建电脑 2010(04)
    • [11].基于本体的信息抽取技术研究[J]. 科技信息(学术研究) 2008(36)
    • [12].基于油田领域本体的信息抽取技术研究[J]. 计算机技术与发展 2015(07)
    • [13].Web信息抽取技术研究[J]. 科技信息 2013(06)
    • [14].基于GATE框架的中文信息抽取技术的研究[J]. 电脑知识与技术 2009(24)
    • [15].藏药药理命名实体识别[J]. 医学信息学杂志 2020(04)
    • [16].中文网页信息抽取技术及分类算法研究[J]. 山东理工大学学报(自然科学版) 2011(03)
    • [17].基于Ontology的信息抽取技术方法分析[J]. 情报理论与实践 2009(02)
    • [18].基于本体的网页数据抽取技术的探讨[J]. 中国多媒体与网络教学学报(上旬刊) 2020(07)
    • [19].基于Web的信息抽取技术探讨[J]. 中国科技信息 2013(04)
    • [20].Web信息抽取技术简述[J]. 河南科技 2013(19)
    • [21].Web信息抽取系统研究综述[J]. 科技创新导报 2010(34)
    • [22].基于Web信息抽取技术的企业情报分析系统的研究[J]. 数字技术与应用 2016(02)
    • [23].基于GATE的油田信息抽取技术研究[J]. 计算机与数字工程 2014(07)
    • [24].WEB就业信息抽取技术研究[J]. 电脑知识与技术 2013(10)
    • [25].基于自动生成模板的Web信息抽取技术[J]. 网络安全技术与应用 2016(09)
    • [26].中医药领域信息抽取技术的研究与应用[J]. 山东科学 2011(06)
    • [27].基于网页结构的WEB信息抽取系统设计[J]. 计算机光盘软件与应用 2012(06)
    • [28].基于DTA的信息抽取技术研究[J]. 计算机应用与软件 2009(12)
    • [29].Web信息抽取技术综述[J]. 计算机应用研究 2010(12)
    • [30].基于VIPS的职位信息抽取技术研究[J]. 软件导刊 2015(09)

    标签:;  ;  ;  ;  ;  

    基于本体的文本信息抽取技术及实现
    下载Doc文档

    猜你喜欢