基于本体的电子产品实体关系抽取研究

基于本体的电子产品实体关系抽取研究

论文摘要

随着因特网和信息产业的快速发展,越来越多的信息出现在人们面前,许多新兴的信息处理技术也应运而生。作为其中基础研究项目的关系抽取技术自然成为研究的热点之一。关系抽取在信息检索、专家系统、垂直搜索等领域有着广泛应用,对其研究具有深远意义。本文首先分析比较了关系抽取的各种技术,并着重研究了机器学习方法中的支持向量机(SVM)算法。研究发现传统的关系抽取技术,例如SVM等,对简单关系抽取的效果很好,但因其不具有语义识别能力,所以对复杂关系的抽取存在一定困难。针对这一问题本文在人工智能领域的本体方向找到了解决方案。在对本体进行了系统研究,对本体建模元素、构建方法深入分析后,本文结合电子产品特征提出了一种适用于关系抽取系统的领域本体建设方法,并选取电子产品中的笔记本电脑领域作为代表进行具体实现。在此基础上为解决上述问题,本文提出一种基于融合模式的关系抽取方法。该方法利用机器学习领域中的支持向量机(SVM)算法进行单一关系抽取,再使用本体对单一关系排错后,将其融合为关系网,最后利用本体的推理功能对关系进行再挖掘,使其形成更为复杂的关系网,用于由近距离依赖结构的关系,推理出远距离依赖结构的关系。这种模式继承了SVM和本体的优点,解决了复杂关系抽取问题。本文最后针对提出模型进行了具体实现。由于选取的本体领域的特殊性,本文自组织语料库,对实现系统进行验证。经分析调整后,取得了很好的准确率和召回率。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义
  • 1.2 国内外研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 论文主要工作
  • 1.4 论文结构
  • 第二章 关系抽取主要方法及工具
  • 2.1 关系抽取的概念
  • 2.2 关系抽取的主要技术
  • 2.2.1 基于规则匹配的关系抽取
  • 2.2.2 基于词典驱动的关系抽取
  • 2.2.3 基于机器学习的关系抽取
  • 2.2.4 基于本体的关系抽取
  • 2.2.5 关系抽取难点
  • 2.3 支持向量机(SVM)
  • 2.3.1 最优分类面
  • 2.3.2 核函数
  • 2.4 关系抽取工具GATE
  • 2.4.1 GATE 组件
  • 2.4.2 GATE 系统的整体框架
  • 2.4.3 抽取规则组件JAPE
  • 2.4.4 基于GATE 的开发方式
  • 2.5 本章小结
  • 第三章 本体及电子产品的本体建设
  • 3.1 本体概念
  • 3.1.1 本体分类
  • 3.1.2 本体的描述语言和常用工具
  • 3.2 本体建模元素
  • 3.3 电子产品领域本体建设方法和应用
  • 3.3.1 本体建设方法
  • 3.3.2 笔记本电脑本体建设
  • 3.4 本章小结
  • 第四章 系统的设计和实现
  • 4.1 系统设计和框架
  • 4.1.1 基于融合的关系抽取方法
  • 4.1.2 系统框架
  • 4.2 预处理模块
  • 4.3 实体识别模块
  • 4.4 关系抽取模块
  • 4.5 关系融合模块
  • 4.6 系统测试结果和分析
  • 4.7 本章小结
  • 第五章 总结与展望
  • 5.1 工作总结
  • 5.2 展望
  • 致谢
  • 参考文献
  • 读研期间研究成果
  • 相关论文文献

    标签:;  ;  

    基于本体的电子产品实体关系抽取研究
    下载Doc文档

    猜你喜欢