基于多代理策略的中文实体关系抽取

基于多代理策略的中文实体关系抽取

论文摘要

当今社会的科技不断进步,信息技术不断发展,互联网也得到了广泛的应用,要从大量的文本信息中抽取出用户感兴趣的信息也成为迫在眉睫的任务。在信息抽取中,实体关系抽取是研究文章中两个实体之间是否存在关系,以及存在何种类型关系的。实体是从文本中提取出来的特定的实时信息,比如:时间、组织机构、人物以及武器等。而实体关系是预先定义好的,比如:地理位置关系,雇佣关系,部分整体关系等。实体关系抽取的研究对满足用户的信息需求起了重要作用,一些问答系统、信息抽取、机器翻译等都需要用到实体关系抽取这个步骤。本文首先使用组合核的方法,将基于特征向量的平面核和基于句法分析树的结构核组合,进行中文实体关系抽取。在ACE RDC 2005中文语料库上进行实体关系大类的抽取实验,其F值达到了68.50%,比两个单独核函数的方法分别提高4.36%和17.37%。说明组合核的方法比单独的特征向量的方法和结构核的方法好,同时也证明了特征向量的方法和结构核的方法可以进行互补。将本文的组合核方法和其他文献的核函数方法的对比说明了利用实体语义信息构造的平面核与结构核组合,比将语义信息添加为树结点的树核方法抽取性能更好。本文在此基础上将多代理引入关系抽取系统中。首先,为每个关系类型选择不同的局部特征集合,构造不同的基层代理;然后,在每个基层代理间进行通信以优化每个基层代理的识别结果,将每个基层代理的识别结果通过集成策略统一起来,作为最终的实验结果。本文将多代理策略应用到ACE RDC 2005中文语料库上进行关系抽取实验,F值为69.72%,比组合核方法提高了1.22%。证明了在实体关系抽取中使用多代理策略是有效的,能够提高关系抽取系统的性能。另外,将本文的关系抽取系统与其他的关系抽取系统进行了对比实验,也证明采用多代理策略是有效的。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 信息抽取的背景及其意义
  • 1.2 信息抽取系统的研究现状
  • 1.2.1 基于规则的方法
  • 1.2.2 基于特征向量的方法
  • 1.2.3 基于核函数的方法
  • 1.3 本文工作与本文结构
  • 2 中文实体关系抽取以及相关模型的介绍
  • 2.1 信息抽取
  • 2.1.1 信息抽取的结构框架
  • 2.1.2 信息抽取的几个重要技术
  • 2.1.3 信息抽取系统的评测
  • 2.2 支持向量机(SVM)原理
  • 2.3 分类器的构造
  • 2.4 ACE语料的介绍
  • 2.4.1 ACE语料中的实体
  • 2.4.2 ACE语料中的实体关系
  • 2.5 多代理系统
  • 2.6 总结
  • 3 基于组合核方法的中文实体关系抽取
  • 3.1 基于特征向量的平面核方法
  • 3.1.1 抽取构造特征向量的实体特征信息
  • 3.1.2 构造特征向量
  • 3.2 基于句法分析树的结构核方法
  • 3.2.1 卷积树核函数
  • 3.2.2 构造结构化关系实例
  • 3.3 组合核方法
  • 3.4 实验及结果分析
  • 3.4.1 实验语料及工具
  • 3.4.2 平面核的特征选择实验
  • 3.4.3 结构核方法的实验
  • 3.4.4 组合核方法的实验
  • 3.5 与文献[20]的比较
  • 3.6 小结
  • 4 基于多代理策略的中文实体关系抽取
  • 4.1 多代理系统的关系抽取框架
  • 4.1.1 多代理系统
  • 4.1.2 基层代理之间的通信
  • 4.1.3 学习算法的选择和敏感特征集合的选择
  • 4.2 基于多代理策略的关系抽取系统
  • 4.3 多代理系统的实验及结果
  • 4.3.1 基层代理的实验结果
  • 4.3.2 多代理系统中的基层代理通信实验
  • 4.4 与其他关系抽取系统的比较
  • 4.5 小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].实体关系抽取综述[J]. 计算机工程与应用 2020(12)
    • [2].小规模知识库指导下的细分领域实体关系发现研究[J]. 情报学报 2019(11)
    • [3].基于句法分析的实体关系抽取[J]. 科技风 2018(15)
    • [4].基于依存句法的实体关系抽取[J]. 电子技术与软件工程 2016(24)
    • [5].实体关系抽取研究综述[J]. 信息工程大学学报 2016(05)
    • [6].基于句法语义特征的中文实体关系抽取[J]. 中文信息学报 2014(06)
    • [7].基于句法语义特征的中文实体关系抽取[J]. 北方文学 2016(20)
    • [8].跨语言情境下基于对抗的实体关系抽取模型研究[J]. 图书情报工作 2020(17)
    • [9].基于协陪义动词的中文隐式实体关系抽取[J]. 计算机学报 2019(12)
    • [10].面向食品安全事件新闻文本的实体关系抽取研究[J]. 农业机械学报 2020(07)
    • [11].基于双向门控循环单元和双重注意力的实体关系抽取[J]. 广东石油化工学院学报 2020(03)
    • [12].面向招投标领域的远程监督实体关系抽取研究[J]. 计算机工程与应用 2020(17)
    • [13].深度学习实体关系抽取研究综述[J]. 软件学报 2019(06)
    • [14].弱监督军事实体关系识别[J]. 电子设计工程 2018(01)
    • [15].基于三支决策的两阶段实体关系抽取研究[J]. 计算机工程与应用 2018(09)
    • [16].中文实体关系抽取研究综述[J]. 计算机与现代化 2018(08)
    • [17].基于规则和本体的实体关系抽取系统研究[J]. 情报杂志 2010(S2)
    • [18].基于卷积神经网络的旅游领域实体关系抽取[J]. 青海师范大学学报(自然科学版) 2019(04)
    • [19].面向医学文本的实体关系抽取研究综述[J]. 郑州大学学报(理学版) 2020(04)
    • [20].中文开放式多元实体关系抽取[J]. 计算机科学 2017(S1)
    • [21].基于实体关系的犯罪网络识别机制[J]. 计算机应用研究 2011(03)
    • [22].集成学习算法在实体关系抽取中的应用[J]. 西安建筑科技大学学报(自然科学版) 2011(03)
    • [23].中文实体关系抽取研究[J]. 计算机工程与设计 2009(15)
    • [24].实体关系识别中长距离依赖问题的研究[J]. 小型微型计算机系统 2008(02)
    • [25].基于单实体语言模型的实体关系发现和描述[J]. 信息工程大学学报 2008(03)
    • [26].实体关系抽取的技术方法综述[J]. 现代图书情报技术 2008(08)
    • [27].实体关系抽取方法研究综述[J]. 计算机研究与发展 2020(07)
    • [28].基于依存分析的军事领域英文实体关系抽取研究[J]. 情报工程 2019(01)
    • [29].面向中文开放领域的多元实体关系抽取研究[J]. 智能系统学报 2019(03)
    • [30].面向中文专利的开放式实体关系抽取研究[J]. 计算机工程与应用 2015(01)

    标签:;  ;  ;  

    基于多代理策略的中文实体关系抽取
    下载Doc文档

    猜你喜欢