基于核函数的中文实体关系抽取新方法

基于核函数的中文实体关系抽取新方法

论文摘要

实体关系抽取是在自然语言文本中识别实体之间语义关系的任务。本文首先提出了一套新颖的基于复合型核函数的中文实体关系抽取方法,它定义在两个独立的核函数基础上,其中一个核函数称为实体核函数,它的关注点是与实体相关特征的相似度,而另一个核函数称为字符串语义相似度核函数,主要关注点是表述上下文文本相关特征的相似度。在此基础上分别引入三种组合方式,分别是线性复合型核函数、半二次复合型核函数和二次复合型核函数,它们能够更加全面地体现两个关系实例之间的相似度。在许多已经成功应用于关系抽取的特征之中,位置特征(如包含、相邻和分离等)是最为重要的特征之一。为了能够提供更为丰富的位置结构信息,本文提出了实体形态树的关系实例表示方法,用以刻画实体之间的位置关系。实体形态树同时还可以揭示各类实体在关系抽取任务中所扮演的角色。利用这样的树形表示,本文提出了基于实体形态树核函数的中文关系抽取方法。在ACE 2005数据集上的评测结果,验证了基于核函数的中文实体关系抽取新方法的有效性和实用性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 背景和现状
  • 1.1 中文命名实体关系抽取简介
  • 1.1.1 推动组织
  • 1.1.2 命名实体关系抽取定义
  • 1.2 实体关系抽取现状
  • 1.2.1 已有的研究
  • 1.2.2 中文的实体关系抽取现状
  • 1.3 论文结构
  • 第二章 理论基础
  • 2.1 依赖树相关理论
  • 2.2 中文分词
  • 2.3 支持向量机理论
  • 2.3.1 支持向量机分类原理
  • 2.3.2 分类器的形式化
  • 2.3.3 软间隔
  • 2.3.4 多类分类方法
  • 2.4 核函数理论
  • 2.4.1 核函数原理
  • 2.4.2 核函数的性质
  • 第三章 算法设计
  • 3.1 基于分类的算法框架
  • 3.2 实体位置特征及相应算法
  • 3.3 基于字符串语义相似度的核方法的算法
  • 3.3.1 实体核函数
  • 3.3.2 字符串语义相似度核函数
  • 3.3.3 复合型核函数
  • 3.4 基于实体形态树的核方法的算法
  • 3.4.1 实体形态树的原理
  • 3.4.2 并列实体的合并
  • 3.4.3 实体形态树核函数
  • 第四章 实验分析
  • 4.1 评价方法
  • 4.2 基于实体位置特征的相关实验
  • 4.3 基于字符串语义相似度核函数的相关实验
  • 4.4 基于实体关系树核函数的相关实验
  • 第五章 总结与展望
  • 参考文献
  • 发表论文和参加科研情况说明
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    基于核函数的中文实体关系抽取新方法
    下载Doc文档

    猜你喜欢