突发事件信息的标注研究

突发事件信息的标注研究

论文摘要

语言资源的建设一直是计算语言学研究领域的基础性课题。作为语言资源的一种重要形式,带标语料库不仅是各种自然语言处理系统评测的金本位,而且也是带有特定语言信息的知识库。目前已经形成资源的汉语带标语料库包括分词、词性标注语料库,短语及句法标注语料库。面向文本中的事件信息的标注语料库还处于起步阶段,其标注的对象、形式、标注方法等都有待于研究。本文从信息提取的角度,对突发事件新闻报道进行事件信息标注的研究,从微观、中观、宏观三个层面,对真实文本中表达事件信息的语言单位进行分析研究,在此基础上将文本中的事件以结构化的形式标注,形成事件的信息结构,以期为文本信息提取、信息检索、文本分类服务。本文的主要工作有:一、对真实文本中表达事件信息的语言单位进行分析,用“意义单元”来概括统称,对其形式、性质、类别、关联方式等进行研究;二、确定了一套事件信息的标注体系,定义了标注内容、标注形式、标注方法,并设计了相应的辅助标注工具;三、根据标注体系对一定量的文本进行标注,并对标注结果进行分析,标注结果表明目前的标注体系能够对文本中的事件信息进行有效的标注。

论文目录

  • 摘要
  • ABSTRACT
  • 1. 绪论
  • 1.1 选题的背景与意义
  • 1.2 事件信息的定义
  • 1.3 事件信息的三个层面
  • 1.4 研究的目标
  • 1.5 研究的内容
  • 1.6 论文的结构
  • 2. 相关研究
  • 2.1 概述
  • 2.2 FrameNet与 PropBank:语言研究角度的事件信息的刻画
  • 2.2.1 FrameNet
  • 2.2.2 PropBank
  • 2.2.3 其他语义资源
  • 2.2.4 小结
  • 2.3 MUC与ACE计划:信息提取角度的事件信息的刻画
  • 2.3.1 MUC
  • 2.3.2 ACE
  • 2.3.3 小结
  • 2.4 RST与PDTB:语篇关系的刻画
  • 2.4.1 RST
  • 2.4.2 PDTB
  • 2.4.3 小结
  • 2.5 TDT
  • 2.6 小结
  • 3. 意义单元的性质与类别
  • 3.1 事件信息的标注对象与意义单元
  • 3.1.1 事件信息与意义单元
  • 3.1.2 事件信息与意义单元的三个层面
  • 3.2 微观层面的事件信息与意义单元
  • 3.2.1 实体、实体表达
  • 3.2.2 时间、时间表达
  • 3.2.3 数值、数值表达
  • 3.2.4 实体属性、实体属性表达
  • 3.2.5 实体关系、实体关系表达
  • 3.3 中观层面的事件信息与意义单元
  • 3.3.1 事件的性质
  • 3.3.2 事件模式
  • 3.3.3 事件的类别
  • 3.4 宏观层面的事件信息与意义单元
  • 3.4.1 为什么要标注事件关系?
  • 3.4.2 事件关系的性质
  • 3.4.3 事件关系的类别
  • 3.4.4 事件关系的其他标注内容
  • 4. 意义单元的标注
  • 4.1 标注形式与标记集
  • 4.1.1 标注形式
  • 4.1.2 标记集
  • 4.2 意义单元的总体标注方法
  • 4.3 标注工具的设计与实现
  • 4.4 标注实例
  • 4.5 标注文本的选择
  • 4.6 事件模式的提取
  • 4.7 事件表达的标注的一些问题
  • 4.8 标注过程中的难点分析
  • 4.8.1 文本中的事件信息与非事件信息
  • 4.8.2 事件的消息来源
  • 4.8.3 事件词的类型
  • 4.8.4 时间表达的标注
  • 4.8.5 标注难点的小结
  • 5. 标注结果与分析
  • 5.1 可标注性分析
  • 5.1.1 多种事件类别的文本的可标注性分析
  • 5.1.2 一种事件类别的文本的可标注性分析
  • 5.1.3 可标注性分析的结论
  • 5.2 事件标注结果分析
  • 5.2.1 多种事件类别的文本的事件标注结果分析
  • 5.2.2 一种事件类别的文本的事件标注结果分析
  • 5.2.3 事件标注结果分析
  • 5.3 事件关系标注结果分析
  • 5.3.1 事件关系标注数据
  • 5.3.2 事件关系的结构
  • 5.3.3 事件关系的形式标记分析
  • 5.4 其他方面问题考察
  • 6. 结语
  • 6.1 总结
  • 6.2 进一步的工作
  • 参考文献
  • 附录1 标注实例
  • 附录2 事件模式论元角色简表
  • 作者在攻读硕士学位期间的科研情况
  • 致谢
  • 相关论文文献

    • [1].突发公共卫生事件网络语料库系统构建[J]. 情报学报 2013(09)
    • [2].华裔美国作家哈金作品《落地》建构的中国形象——基于语料库的考察[J]. 乐山师范学院学报 2019(11)
    • [3].近十年国际语料库翻译研究文献计量分析(2008-2018)[J]. 外语与外语教学 2019(06)
    • [4].科技大数据背景下的中英双语语料库的构建及其特点研究[J]. 中国科技资源导刊 2019(06)
    • [5].浅析信息技术背景下口译语料库的研究现状及进展[J]. 教育现代化 2019(99)
    • [6].语料库在俄语教学中的应用探究[J]. 科技风 2020(08)
    • [7].文学作品的语料库检索分析——以小说《呼啸山庄》为例[J]. 现代交际 2020(04)
    • [8].音乐口述史语料库分析方法的理论原理与操作步骤[J]. 中国音乐 2020(01)
    • [9].基于语料库“刚刚”“刚才”的维译对比研究[J]. 汉字文化 2019(23)
    • [10].语料库技术辅助汉译英教学模式探索[J]. 科技视界 2020(03)
    • [11].基于语料库的对话口译模糊限制语性别研究[J]. 甘肃广播电视大学学报 2020(01)
    • [12].《基于语料库的语法研究》评介[J]. 南昌师范学院学报 2019(05)
    • [13].国内基于语料库的翻译研究二十年综述(1999—2018)[J]. 成都理工大学学报(社会科学版) 2020(01)
    • [14].语料库翻译学:在名与实之间[J]. 外语学刊 2020(01)
    • [15].《诗经》汉英平行历时语料库研制与应用[J]. 沈阳大学学报(社会科学版) 2020(02)
    • [16].言者顺应:基于语料库驱动视角[J]. 广东石油化工学院学报 2020(02)
    • [17].基于语料库的习近平国际峰会主旨演讲高频词研究[J]. 法制与社会 2020(11)
    • [18].浅谈中日农业术语对译语料库的建设[J]. 农家参谋 2020(16)
    • [19].基于历时语料库的“先生”称谓语用嬗变研究[J]. 教育教学论坛 2020(18)
    • [20].基于历时语料库的“度”字义项演变探微[J]. 汉字文化 2020(09)
    • [21].俄汉可比语料库翻译等价物抽取的方法设计及应用展望[J]. 欧亚人文研究 2019(01)
    • [22].国内基于语料库的翻译显化和隐化研究综述[J]. 牡丹江大学学报 2020(06)
    • [23].国内语料库翻译研究现状及未来走向探讨[J]. 英语广场 2020(16)
    • [24].基于语料库汉语人体部位词“脸”的认知研究[J]. 汉字文化 2020(10)
    • [25].基于历时语料库的在线词典编纂系统设计[J]. 中文信息学报 2020(05)
    • [26].基于语料库及其技术的思政课优质教学资源建设与共享研究[J]. 思想政治课研究 2020(03)
    • [27].海外社交平台的广州城市形象呈现——基于推特十年涉穗话语语料库分析[J]. 国际传播 2020(03)
    • [28].语料库翻译学视阈下的意识形态显化——《语料库批评翻译学概论》述评[J]. 山东外语教学 2020(04)
    • [29].自建语料库在商务英语翻译教学中的应用[J]. 宁波广播电视大学学报 2020(03)
    • [30].基于语料库的多维翻译文体评估——以《骆驼祥子》的葛浩文译本为例[J]. 海外英语 2020(16)

    标签:;  ;  ;  

    突发事件信息的标注研究
    下载Doc文档

    猜你喜欢