论文摘要
实体关系抽取是在自然语言文本中识别实体之间语义关系的任务。本文首先提出了一套新颖的基于复合型核函数的中文实体关系抽取方法,它定义在两个独立的核函数基础上,其中一个核函数称为实体核函数,它的关注点是与实体相关特征的相似度,而另一个核函数称为字符串语义相似度核函数,主要关注点是表述上下文文本相关特征的相似度。在此基础上分别引入三种组合方式,分别是线性复合型核函数、半二次复合型核函数和二次复合型核函数,它们能够更加全面地体现两个关系实例之间的相似度。在许多已经成功应用于关系抽取的特征之中,位置特征(如包含、相邻和分离等)是最为重要的特征之一。为了能够提供更为丰富的位置结构信息,本文提出了实体形态树的关系实例表示方法,用以刻画实体之间的位置关系。实体形态树同时还可以揭示各类实体在关系抽取任务中所扮演的角色。利用这样的树形表示,本文提出了基于实体形态树核函数的中文关系抽取方法。在ACE 2005数据集上的评测结果,验证了基于核函数的中文实体关系抽取新方法的有效性和实用性。
论文目录
相关论文文献
标签:字符串语义相似度核函数论文; 复合型核函数论文; 实体形态树论文;