导读:本文包含了抽取机制论文开题报告文献综述及选题提纲参考文献,主要关键词:关系抽取,远程监督,ENCODER,注意力机制
抽取机制论文文献综述
王健,郑七凡,李超,石晶[1](2019)在《基于ENCODER_ATT机制的远程监督关系抽取》一文中研究指出在信息抽取中,关系抽取是一项准确识别自然语言中实体间关系的关键技术。针对关系抽取模型中容易丢失关键语义特征问题及远程监督的基本假设容易引入噪声数据的问题,本文提出一种基于远程监督的ENCODER_ATT关系抽取模型。基于循环神经网络构造的ENCODER模型在以词级别进行特征记忆提取,并在句子层面进行语义特征信息整合,保证不遗失关键语义特征的同时去除冗余特征。然后在句子层面引入了注意力机制来降低噪声数据对实验结果的影响。在真实的数据集上进行实验,并绘制准确率-召回率曲线,实验结果表明ENCODER_ATT模型对比同类型的关系抽取方法有明显的提升。(本文来源于《广西师范大学学报(自然科学版)》期刊2019年04期)
陈振彬,叶颖雅,冯浩男,李明轩,陈珂[2](2019)在《多特征融合与注意力机制的中文文本关系抽取》一文中研究指出在中文关系抽取任务中,数据稀疏和噪声传播问题是其研究难点。基于此,提出了在文本特征组织方面融合位置特征、最短依存特征和N-gram特征等多元特征,并提升关键性特征的权重,以缓解传统词特征的数据稀疏问题。这种组合特征进一步改善了文本中噪声传播问题,提高了句法特征在稀疏性问题下的可靠性。此外,在传统的双向LSTM神经网络中加入注意力机制,使模型更关注较为重要的特征,降低噪声对抽取任务的影响。在人物关系公开语料集上进行实验,结果表明采用该方法进行中文文本关系抽取的效果较好,并为信息抽取、知识图谱等领域提供了方法支持。(本文来源于《广东石油化工学院学报》期刊2019年04期)
冯建周,宋沙沙,王元卓,刘亚坤,武红颖[3](2019)在《基于改进注意力机制的实体关系抽取方法》一文中研究指出实体关系抽取是知识库构建中至关重要的一个环节.在众多的实体关系抽取方法中,远程监督结合神经网络模型的方法在准确率等性能上是比较令人满意的,但远程监督获取的标注语料中往往存在大量的噪声数据,给实体关系抽取模型的训练带来了很大的影响.本文提出一种基于改进注意力机制的卷积神经网络实体关系抽取模型.该模型针对包含同一实体对的句子集合,从中尽可能地找出所有体现该实体对关系的正实例,构建组合句子向量,抛弃可能的噪声句子,从而最大程度地降低噪声句子的影响又能充分利用正实例的语义信息.实验证明,本文提出的关系抽取模型在准确率上优于对比的关系抽取模型.(本文来源于《电子学报》期刊2019年08期)
李浩,刘永坚,解庆,唐伶俐[4](2019)在《基于多层次注意力机制的远程监督关系抽取模型》一文中研究指出实体关系抽取作为信息抽取的主要任务之一,其目的在于确定无结构文本中两个实体的关系类别。目前准确率较高的有监督方法由于需要大量的人工标注语料而受到了限制,而远程监督方法则通过知识库与文本集进行启发式对齐来获取大量关系叁元组,这是解决大规模关系抽取任务的主要途径。针对目前远程监督关系抽取的研究未能充分利用句子上下文词语的高层语义,以及未考虑关系之间的依赖包含关系的问题,文中提出了一种基于多层次注意力机制的远程监督关系抽取模型。该模型首先通过双向GRU(Gate Recurrent Unit)神经网络对句子词向量进行编码来获取句子高维语义;其次通过引入词语层注意力来计算两个实体与上下文词语的相关程度,从而充分捕捉句子中实体上下文的语义信息;然后在多个实例上构建句子层的注意力来减少标签错误标注的问题;最后通过关系层的注意力自动学习不同关系之间的依赖包含关系。在FreeBase+NYT公共数据集上的实验结果表明,在双向GRU模型的基础上引入词语层、句子层和关系层注意力机制对提高远程监督关系抽取的效果都起到了促进作用;将叁层注意力机制进行融合得到的多层次注意力机制关系抽取模型的准确率和召回率相较于现有的主流方法提高了4%左右,更好地实现了关系抽取,从而为进一步构建知识图谱、智能问答等应用奠定了理论基础。(本文来源于《计算机科学》期刊2019年10期)
张鸿洋,毛建华,刘学锋,张豪杰[5](2019)在《基于分层分段注意力机制的企业关系抽取》一文中研究指出现有研究多采用抽取语法特征构建特征向量的方式完成企业关系抽取任务。但企业文本语法特征复杂,长程依赖明显。根据企业文本的特点,提出基于Bi-GRU网络抽取文本特征、分段词汇层注意力机制及句子层注意力机制从多个维度抽取企业文本的整体特征。实验表明,在公开的上市公司关系数据中,准确率、召回率和F值相较于Bi-LSTM方法有明显的提高。(本文来源于《工业控制计算机》期刊2019年07期)
刘勇杰[6](2019)在《基于注意力机制的开放域实体关系抽取》一文中研究指出大词林是一个有自动构建能力的网状知识图谱,所谓的网状结构,是指知识的横向性与纵向性。实体之间的关系、一个上位词的同义词都属于横向上的关系,而实体与上位词的关系、上位词之间的层次关系,都属于纵向上的关系。本课题主要为大词林提供辅助,旨在为大词林提供稳定的横向关系补充,即实体间关系的补充。1.针对大词林中纵向关系中实体与横向关系中实体不统一的问题,即实体路径消歧,本文首先提出基于词向量相似度计算的方法,将实体路径信息与实体义项对应,将实体路径信息与实体义项当做两个字符串,利用腾讯提供的词向量计算余弦相似度。该方法对于语义特征较为明显的情况处理效果较好。但在中文中,有很多词是具有对立含义的,为了挖掘文本背后的“对立”关联,本文引进了基于深度学习的实体路径消歧,包括ELMO模型与Bert模型,并对两类模型结果进行了分析。2.在开放域关系抽取任务中,针对中文领域关系抽取任务缺少语料的问题,本文提出了一种基于启发式规则的关系抽取方法,采用4类启发式规则模板并辅以搜索引擎结果计算置信度,得到初步实验效果,并为有监督方法提供语料。随后,针对开放域关系抽取难度大的特点,本文引入了端到端的关系抽取方法,以改善主流方法依赖命名实体识别且关系类型限定的不足,模型在获得关系的同时,将头实体与尾实体一并得出,将命名实体识别与关系抽取任务的联系在一起,最后辅以搜索引擎进一步增强实验结果,使得模型更加适应于中文数据集。3.在从文本中获取完关系叁元组后,需要将关系叁元组中的头实体,尾实体对应到具体的实体义项,即实体映射。本文提出了一种结合本文信息的实体映射方法,通过transformer网络结构来学习文本信息与实体义项的特征表示,通过带有实体义项信息的特征表示来预测文本中抽取的头尾实体是否属于该实体义项的概率。实验显示该方法达到了预期效果。(本文来源于《哈尔滨工业大学》期刊2019-06-01)
吴粤敏,丁港归,胡滨[7](2019)在《基于注意力机制的农业金融文本关系抽取研究》一文中研究指出【目的】研究中文文本中关系自动抽取的方法。【方法】以224家农业上市公司2015年–2017年的678份年报为数据来源,采用基于双重注意力机制的门控循环单元算法,进行中文文本关系自动抽取研究。【结果】最终模型在农业金融文本数据集上的平均准确率达78%,相较循环神经网络算法,该算法平均准确率提高约12%。【局限】仅针对224家农业上市公司的数据进行研究,研究涉农企业对象有待进一步拓展。【结论】该模型能够在农业金融相关文本的关系抽取上取得较好效果。(本文来源于《数据分析与知识发现》期刊2019年05期)
沈兰奔[8](2019)在《结合注意力机制与长短期记忆网络的中文事件抽取方法研究》一文中研究指出互联网如今已经成为人们获取信息的主要途径之一,人们可以轻松快速地从互联网上获取各种各样的信息。但是,伴随着互联网上的信息呈指数式增长,人们置身于一个信息爆炸的环境中,每天面对铺天盖地的各种信息,甚至已经严重超出了人们的承受范围。因此,如何从海量的信息中找到人们真正关心的信息已成为当前亟待解决的一个问题,信息抽取由此而成为大家关注的重点。事件抽取技术研究是信息抽取研究领域中一个极为重要的子任务,也是当前信息抽取研究任务中的难点和热点之一。事件抽取的任务就是从自然语言描述的海量非结构化文本中抽取用户关心和感兴趣的事件(包括事件的类型和子类型以及事件所涉及的实体、时间及数值等元素),然后用结构化的形式保存和呈现,提供给用户浏览。抽取的事件还可以作为输入信息,提供给机器翻译、文本检索、知识图谱、推荐系统等多种应用,具有重要的实际应用价值和学术研究意义。本文主要面对中文事件抽取,研究中文事件的检测与分类以及中文事件的元素角色抽取。事件检测与分类任务其实是识别事件触发词的过程,这个过程分为两步:触发词识别和触发词分类。本文结合注意力机制和长短期记忆神经网络,提出了 ATT-BiLSTM算法,不依赖词性标注和实体识别,不需要人工设置特征,合二为一地进行事件检测与分类。该方法可以捕捉文本的局部信息和全局信息,通过在ACE 2005中文事件语料集上设置对比实验,相对于传统的模式匹配方法、机器学习方法以及一些现有的深度学习方法,ATT-BiLSTM算法在性能方面有了明显提升。事件元素角色抽取任务分为元素识别和元素角色分类两步。结合通过事件检测与分类获得的事件触发词信息,本文提出了一种结合注意力机制和双层BiLSTM的ATT-DBiLSTM算法,用来完成事件元素角色的抽取。通过引入触发词信息,弥补了事件元素角色抽取中结构特征过于松散的缺陷。通过在ACE2005中文事件语料集与其他现有方法进行对比,本文提出的ATT-DBiLSTM算法明显提高了事件元素角色抽取的性能。(本文来源于《北京交通大学》期刊2019-05-01)
孟碧霄[9](2019)在《基于弱监督和注意机制神经网络的生物实体关系抽取研究》一文中研究指出关系抽取是自然语言处理(Nature Language Processing,NLP)任务的一个重要分支,关系抽取任务的主要内容是获取语料中目标实体间的关系信息,其实是一个多分类的过程。关系抽取在“知识图谱构建”、“问答系统”等任务中都有很广泛的应用。关系抽取任务早期使用“条件随机场”等传统方法比较多,但面对日益复杂的数据结构和海量的待处理数据,传统方法逐渐无法达到期望的效果。近年来,随着深度学习技术的发展,使用卷积神经网络、循环神经网络等进行关系抽取任务可以获取更多的语料信息,抽取结果也更加准确。与此同时,关系抽取在生物医学实体中的应用也越来越广泛。生物知识库的构建、医学数据的整理都离不开关系抽取。在关系抽取任务中,存在着处理的过程中对目标词的集中度不够,对词的语义信息缺乏利用等问题。同时鉴于生物医学实体的特殊性,需要对网络模型进行针对性的调整。本文设计了两个关系抽取模型:(1)针对长文本上下文信息容易丢失的问题和语料中不同句子以及句中不同词对实体关系抽取结果影响不同的情况,提出了多重注意机制门控循环单元模型(Multiple Attention GRU,MAGRU)。模型以双向长短期记忆网络(Long Short-Term Memory,LSTM)的变型门控循环单元(Gated Recurrent Unit,GRU)为基础,并在此基础上分别在对词和句子进行处理的时候增加注意机制,形成多重注意机制GRU模型。同时考虑到生物医学文本的特殊性,通过调整模型的注意机制来适应生物医学实体关系抽取的要求。使用模型分别在传统数据集和生物医学数据集上与现有效果较好的方法进行对比实验,实验结果表明,MAGRU模型比现有模型F值有至少1%的优势。(2)针对关系抽取任务对语料中的语义信息利用不足,尤其是生物医学文本中语义信息对关系抽取效果影响更大的情况,本文在多重注意机制模型(MAGRU)的基础上引入词的命名体信息和词性信息等其他语义信息作为输入数据的补充,同时在生物医学文本关系抽取实验中增加具有生物医学背景的语义信息,并结合注意机制进行调整。本文使用模型分别在传统数据集和生物医学数据集上进行与现有效果较好的方法以及无语义信息的MAGRU模型进行对比实验,实验结果表明,引入语义信息的MAGRU模型比其他模型在F值上有3%左右的提升。(本文来源于《北京交通大学》期刊2019-05-01)
周文烨,刘亮亮,张再跃[10](2019)在《融合多层注意力机制与双向LSTM的语义关系抽取》一文中研究指出关系抽取是构建如知识图谱等上层自然语言处理应用的基础。针对目前大多数关系抽取模型中忽略部分文本局部特征的问题,设计一种结合实体位置特征与多层注意力机制的双向LSTM网络结构。首先根据位置特征扩充字向量特征,并将文本信息向量化,然后将文本向量化信息输入双向LSTM模型,通过多层注意力机制,提高LSTM模型输入与输出之间的相关性,最后通过分类器输出关系获取结果。使用人工标注的百科类语料进行语义关系获取实验,结果表明,改进方法优于传统基于模式匹配的关系获取方法。(本文来源于《软件导刊》期刊2019年07期)
抽取机制论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在中文关系抽取任务中,数据稀疏和噪声传播问题是其研究难点。基于此,提出了在文本特征组织方面融合位置特征、最短依存特征和N-gram特征等多元特征,并提升关键性特征的权重,以缓解传统词特征的数据稀疏问题。这种组合特征进一步改善了文本中噪声传播问题,提高了句法特征在稀疏性问题下的可靠性。此外,在传统的双向LSTM神经网络中加入注意力机制,使模型更关注较为重要的特征,降低噪声对抽取任务的影响。在人物关系公开语料集上进行实验,结果表明采用该方法进行中文文本关系抽取的效果较好,并为信息抽取、知识图谱等领域提供了方法支持。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
抽取机制论文参考文献
[1].王健,郑七凡,李超,石晶.基于ENCODER_ATT机制的远程监督关系抽取[J].广西师范大学学报(自然科学版).2019
[2].陈振彬,叶颖雅,冯浩男,李明轩,陈珂.多特征融合与注意力机制的中文文本关系抽取[J].广东石油化工学院学报.2019
[3].冯建周,宋沙沙,王元卓,刘亚坤,武红颖.基于改进注意力机制的实体关系抽取方法[J].电子学报.2019
[4].李浩,刘永坚,解庆,唐伶俐.基于多层次注意力机制的远程监督关系抽取模型[J].计算机科学.2019
[5].张鸿洋,毛建华,刘学锋,张豪杰.基于分层分段注意力机制的企业关系抽取[J].工业控制计算机.2019
[6].刘勇杰.基于注意力机制的开放域实体关系抽取[D].哈尔滨工业大学.2019
[7].吴粤敏,丁港归,胡滨.基于注意力机制的农业金融文本关系抽取研究[J].数据分析与知识发现.2019
[8].沈兰奔.结合注意力机制与长短期记忆网络的中文事件抽取方法研究[D].北京交通大学.2019
[9].孟碧霄.基于弱监督和注意机制神经网络的生物实体关系抽取研究[D].北京交通大学.2019
[10].周文烨,刘亮亮,张再跃.融合多层注意力机制与双向LSTM的语义关系抽取[J].软件导刊.2019