基于知网语义关系的中文事件信息抽取研究

基于知网语义关系的中文事件信息抽取研究

论文摘要

随着Internet技术的不断发展,网上的文本信息数量成指数级增长,大量非结构化信息的激增使得“信息爆炸与知识饥渴”的矛盾日趋激烈,因此如何自动地使非结构化信息结构化是目前重要的研究课题,事件信息抽取研究正是在这种背景下产生的。作为信息抽取研究的一项高级任务,事件抽取的评测还不理想,尤其是中文事件抽取,基础研究和任务要求之间存在较大矛盾。目前还没有成熟的实用系统出现,相关领域还有待进一步研究。本文采用模式匹配和机器学习相结合的方法进行中文事件信息抽取研究,事件信息抽取的基本思路按照模式匹配方法的基本过程展开,在进行事件语义角色标注和事件具体信息槽填充过程中运用统计学方法。本文针对事件信息抽取研究中语义缺失的问题,引入知网语义关系知识资源来识别信息之间的语义关联。中文命名实体识别过程中,利用模式匹配方法结合基于知网的词语相似度计算方法,对事件基本信息(包括事件的时间、地点等)进行了识别,此过程是事件信息抽取的基础工作,在实验评测中取得了较好效果。本文提出利用知网中的事件类概念语义资源对事件进行语义标注,解决了事件信息抽取研究中触发词探测和语义角色标注困难的问题。最后针对具体研究对象——同事件多文本灾难性事件,构建层式框架表示各类信息,进而采用层式有限状态自动机方法进行事件信息的抽取。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义
  • 1.2 信息抽取发展历史及研究现状
  • 1.2.1 信息抽取发展历史
  • 1.2.2 国内外研究现状
  • 1.3 中文事件信息抽取难点
  • 1.3.1 中文信息处理难点
  • 1.3.2 事件信息抽取难点
  • 1.4 本文研究内容
  • 1.5 论文结构
  • 第二章 中文事件信息抽取
  • 2.1 事件信息抽取关键技术
  • 2.1.1 词法分析
  • 2.1.2 汉语词性标注
  • 2.1.3 句法分析
  • 2.1.4 语义角色标注
  • 2.2 事件抽取系统构建方法
  • 2.2.1 基于模式匹配法构建事件抽取系统
  • 2.2.2 基于机器学习方法构建事件抽取系统
  • 2.2.3 事件抽取方法比较
  • 2.3 事件抽取任务描述
  • 2.3.1 信息抽取任务分类
  • 2.3.2 事件与事件抽取
  • 2.3.3 事件-实体关系
  • 2.4 知网语义关系
  • 2.4.1 知网基本概念
  • 2.4.2 基于知网的语义相似度计算
  • 2.4.3 知网中的事件类概念
  • 2.5 本章小结
  • 第三章 中文事件中的命名实体识别
  • 3.1 命名实体识别过程
  • 3.2 知网语义相似度在NER 中的应用
  • 3.3 事件基本信息识别
  • 3.3.1 时间信息识别
  • 3.3.2 地点信息识别
  • 3.3.3 机构名及数字信息识别
  • 3.4 本章小结
  • 第四章 中文事件侧面信息抽取
  • 4.1 事件框架构建
  • 4.1.1 框架表示法
  • 4.1.2 事件框架
  • 4.2 事件触发词识别
  • 4.3 事件语义角色标注
  • 4.3.1 条件随机场
  • 4.3.2 参数估计与特征选择
  • 4.3.3 事件语义角色标注
  • 4.4 基于层式有限状态自动机的事件侧面信息抽取
  • 4.4.1 有限状态自动机
  • 4.4.2 事件的层式结构及侧面信息判定
  • 4.4.3 事件侧面槽值填充
  • 4.5 事件抽取模式获取
  • 4.6 事件信息抽取方法总结
  • 4.7 本章小结
  • 第五章 事件抽取实验及结果分析
  • 5.1 实验语料准备
  • 5.2 命名实体识别实验
  • 5.2.1 系统逻辑结构设计
  • 5.2.2 系统功能实现
  • 5.3 事件信息抽取实验
  • 5.4 结果分析
  • 5.4.1 评测标准
  • 5.4.2 实验结果分析
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 本文总结
  • 6.2 进一步的工作
  • 致谢
  • 参考文献
  • 作者在攻读硕士期间的科研成果
  • 相关论文文献

    • [1].突发公共事件信息公开与舆论引导[J]. 视听纵横 2017(04)
    • [2].应急管理:地方政府和民众公共事件信息信任危机审析[J]. 长江论坛 2010(05)
    • [3].自治区人民政府办公厅关于进一步加强和改进突发公共事件信息报告工作的通知[J]. 宁夏回族自治区人民政府公报 2018(16)
    • [4].内蒙古自治区人民政府办公厅关于印发自治区突发公共事件信息报告制度(试行)的通知[J]. 内蒙古政报 2010(09)
    • [5].网络环境下的政府信息公开建设——以突发公共事件信息公开为例[J]. 图书馆理论与实践 2013(04)
    • [6].突发公共事件信息传播相关法律规制对策研究[J]. 河北青年管理干部学院学报 2012(01)
    • [7].面向文本的事件信息抽取方法的研究[J]. 计算机与现代化 2012(07)
    • [8].事件信息结构分析[J]. 中文信息学报 2012(03)
    • [9].社交媒体中危机事件信息可信度研究[J]. 中国报业 2017(08)
    • [10].内蒙古自治区人民政府办公厅关于切实做好突发公共事件信息上报工作的紧急通知[J]. 呼和浩特政报 2009(04)
    • [11].我国大中城市处理突发公共事件信息管理模式研究[J]. 河北科技大学学报(社会科学版) 2009(03)
    • [12].高校突发公共事件信息在大学生中传播的风险防控研究——基于对四川水利职业技术学院学生的实证调查[J]. 大众标准化 2020(21)
    • [13].面向数字资源长期保存事件信息的语义组织研究[J]. 图书馆界 2017(06)
    • [14].新媒体环境下我国突发公共事件信息发布与管理初探[J]. 图书情报工作 2011(03)
    • [15].突发公共事件信息公开检讨:义务主体、公开范围与责任体系[J]. 城市治理研究 2020(01)
    • [16].融合事件信息的复杂问句分析方法[J]. 华南理工大学学报(自然科学版) 2011(07)
    • [17].论高校非稳定事件信息的监测与识别[J]. 中国市场 2011(52)
    • [18].青海省人民政府办公厅印发关于进一步加强和改进突发公共事件信息报送工作实施意见的通知[J]. 青海政报 2008(04)
    • [19].多参数监护中睡眠呼吸事件信息的提取[J]. 中国数字医学 2016(07)
    • [20].突发公共事件信息传播中存在的问题及相关对策研究[J]. 工会论坛(山东省工会管理干部学院学报) 2012(01)
    • [21].内蒙古自治区人民政府办公厅关于切实做好突发公共事件信息上报工作的紧急通知[J]. 内蒙古政报 2009(09)
    • [22].农业部关于切实加强农业突发公共事件信息调度与报送工作的通知[J]. 中华人民共和国农业部公报 2011(04)
    • [23].用规则抽取句子中事件信息[J]. 小型微型计算机系统 2011(11)
    • [24].应急管理:对地方政府和民众公共事件信息信任危机的审析[J]. 广西青年干部学院学报 2010(03)
    • [25].甘肃省人民政府办公厅关于印发《甘肃省突发公共事件信息报告情况通报办法(试行)》的通知[J]. 甘肃政报 2008(04)
    • [26].自治区人民政府办公厅关于印发宁夏回族自治区突发公共事件信息报告情况通报办法(试行)的通知[J]. 宁夏回族自治区人民政府公报 2008(14)
    • [27].论城市公共事件信息系统构建[J]. 皖西学院学报 2008(02)
    • [28].公共突发事件报道中新闻记者应具备的素养[J]. 新闻传播 2020(16)
    • [29].论自媒体时代突发舆情事件的构成要素及引导策略[J]. 西部广播电视 2016(18)
    • [30].政府和媒体在突发公共事件中的信息发布[J]. 商品与质量 2010(SA)

    标签:;  ;  ;  ;  

    基于知网语义关系的中文事件信息抽取研究
    下载Doc文档

    猜你喜欢