基于核函数的中文实体关系抽取新方法
论文摘要
实体关系抽取是在自然语言文本中识别实体之间语义关系的任务。本文首先提出了一套新颖的基于复合型核函数的中文实体关系抽取方法,它定义在两个独立的核函数基础上,其中一个核函数称为实体核函数,它的关注点是与实体相关特征的相似度,而另一个核函数称为字符串语义相似度核函数,主要关注点是表述上下文文本相关特征的相似度。在此基础上分别引入三种组合方式,分别是线性复合型核函数、半二次复合型核函数和二次复合型核函数,它们能够更加全面地体现两个关系实例之间的相似度。在许多已经成功应用于关系抽取的特征之中,位置特征(如包含、相邻和分离等)是最为重要的特征之一。为了能够提供更为丰富的位置结构信息,本文提出了实体形态树的关系实例表示方法,用以刻画实体之间的位置关系。实体形态树同时还可以揭示各类实体在关系抽取任务中所扮演的角色。利用这样的树形表示,本文提出了基于实体形态树核函数的中文关系抽取方法。在ACE 2005数据集上的评测结果,验证了基于核函数的中文实体关系抽取新方法的有效性和实用性。
论文目录
摘要ABSTRACT第一章 背景和现状1.1 中文命名实体关系抽取简介1.1.1 推动组织1.1.2 命名实体关系抽取定义1.2 实体关系抽取现状1.2.1 已有的研究1.2.2 中文的实体关系抽取现状1.3 论文结构第二章 理论基础2.1 依赖树相关理论2.2 中文分词2.3 支持向量机理论2.3.1 支持向量机分类原理2.3.2 分类器的形式化2.3.3 软间隔2.3.4 多类分类方法2.4 核函数理论2.4.1 核函数原理2.4.2 核函数的性质第三章 算法设计3.1 基于分类的算法框架3.2 实体位置特征及相应算法3.3 基于字符串语义相似度的核方法的算法3.3.1 实体核函数3.3.2 字符串语义相似度核函数3.3.3 复合型核函数3.4 基于实体形态树的核方法的算法3.4.1 实体形态树的原理3.4.2 并列实体的合并3.4.3 实体形态树核函数第四章 实验分析4.1 评价方法4.2 基于实体位置特征的相关实验4.3 基于字符串语义相似度核函数的相关实验4.4 基于实体关系树核函数的相关实验第五章 总结与展望参考文献发表论文和参加科研情况说明致谢
相关论文文献
本文来源: https://www.lw50.cn/article/139e227b7a4791745bf56785.html