汉语框架语义角色自动标注研究

汉语框架语义角色自动标注研究

论文摘要

随着计算机的出现和发展及其在自然语言处理领域的应用,大幅提高了语言信息的处理速度和质量,由于深层语义理解在目前条件和技术下难以实现,自然语言研究学者开始将注意力集中在简单、实用的任务上,于是“浅层语义分析(Shallow Semantic Parsing)”逐渐被研究人员所重视。语义角色标注则是浅层语义分析的一种可行方案。二十世纪末C.J.Fillmore提出了框架语义学,它试图形式化描述词在其每个义项下的语义和句法相互作用的配价模式。在此基础上,构建了英语框架网络(FrameNet)。之后许多国家的学者相继研究了本国语言的框架语义,建立了相应的词汇知识库。并研究了计算机辅助自动标注系统。本文使用由山西大学研制的汉语框架网络知识库作为语料资源通过统计机器学习方法研究了语义角色的自动标注问题。本文基于条件随机场(CRF,condition random fields)模型,研究框架语义角色的自动标注模型。该模型以词作为标注的基本单元,通过BIO策略,把语义角色标注问题转化为序列符号的分类问题,用CRF模型对句子中目标词的语义角色同时进行边界识别和分类。我们通过选择词、词性、位置、基本短语块、功能块等特征,对不同特征模板的实验结果进行比较,得到了一组最优的特征模板。在完成语义角色标注的基础上,对框架语义的三层标记中的的短语类型和句法功能再进行建模、以及训练和测试。最终实现,框架语义的三层标记的自动标注。本文中最重要的工作就是对给定的框架,给定的目标词,如何选取一组好的特征,使得选取的特征模板有较好的泛化能力。本文使用准确率P,召回率R和Fβ=1作为评价标准。对不同的框架分别以Fβ=1为主要指标得到该框架的最佳特征模板,但其方法具有一般性,适用于其他框架的自动标注。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 研究目的
  • 1.1.1 研究的社会背景
  • 1.1.2 语义分析的历史
  • 1.1.3 浅层语义分析现状
  • 1.2 研究意义
  • 1.2.1 信息抽取
  • 1.2.2 自动问答
  • 1.2.3 机器翻译
  • 1.2.4 其它应用
  • 1.3 论文结构安排
  • 第二章 汉语框架网络
  • 2.1 框架网络
  • 2.2 汉语框架网络
  • 2.2.1 CFN框架库
  • 2.2.2 CFN句子库
  • 2.2.3 CFN词元库
  • 第三章 汉语框架语义角色自动标注
  • 3.1 研究方法
  • 3.1.1 汉语框架语义角色标注语料库
  • 3.1.2 数据集的划分
  • 3.2 汉语框架语义角色标注模型概述
  • 3.3 条件随机场(CRF)算法简介
  • 3.3.1 马尔科夫随机场
  • 3.3.2 条件随机场(CRF)的定义
  • 3.3.3 条件随机场(CRF)参数估计
  • 3.3.4 小结
  • 3.4 基于CRF算法的框架语义角色标注模型
  • 3.4.1 标注过程
  • 3.4.2 CRF++软件包简介
  • 3.4.3 基本块标注和功能块标注
  • 3.4.4 特征模板的比较与选择
  • 3.4.5 实验结果
  • 3.4.6 小结
  • 第四章 短语类型标注和句法功能标注
  • 4.1 短语类型标注
  • 4.1.1 基本特征对短语类型标注的影响
  • 4.1.2 语义角色对短语类型标注的影响
  • 4.1.3 小结
  • 4.2 句法功能标注
  • 4.2.1 基本特征对句法功能标注影响
  • 4.2.2 语义角色和短语类型对句法功能标注的影响
  • 4.2.3 小结
  • 第五章 总结和展望
  • 5.1 汉语框架语义角色标注总结
  • 5.2 未来研究的展望
  • 参考文献
  • 发表文章目录
  • 致谢
  • 个人简历
  • 相关论文文献

    • [1].论元角色的藏语语义角色标注研究[J]. 高原科学研究 2018(03)
    • [2].基于规则的“把”字句语义角色标注[J]. 中文信息学报 2017(01)
    • [3].蒙古文语义角色研究概述[J]. 内蒙古师范大学学报(哲学社会科学版) 2014(06)
    • [4].中文语义角色标注研究概述[J]. 文教资料 2012(27)
    • [5].格语法视域下的汉语语序与语义角色关系探究[J]. 北京化工大学学报(社会科学版) 2018(04)
    • [6].《语义角色研究进展》述介[J]. 当代语言学 2019(04)
    • [7].一种规则与统计相结合的应用题句子语义角色识别方法[J]. 计算机应用研究 2018(08)
    • [8].语义角色理论述评[J]. 河南理工大学学报(社会科学版) 2018(04)
    • [9].基于语义角色标注的专利主题提取研究[J]. 图书情报工作 2014(19)
    • [10].基于分层输出神经网络的汉语语义角色标注[J]. 中文信息学报 2014(06)
    • [11].语义角色标注及其在科技情报分析中的应用研究[J]. 情报理论与实践 2015(01)
    • [12].基于依存特征的汉语框架语义角色自动标注[J]. 中文信息学报 2013(02)
    • [13].基于文献计量的国内语义角色标注研究现状分析[J]. 情报杂志 2012(04)
    • [14].基于特征组合的中文语义角色标注[J]. 软件学报 2011(02)
    • [15].基于语义角色标注的新闻领域复述句识别方法[J]. 中文信息学报 2010(05)
    • [16].中文问答系统中语义角色标注的研究与实现[J]. 科学技术与工程 2008(10)
    • [17].基于外部记忆单元和语义角色知识的文本复述判别模型[J]. 中文信息学报 2017(06)
    • [18].基于语义角色标注的文本水印算法[J]. 计算机应用研究 2017(04)
    • [19].小句补语句小句主语语义角色探析[J]. 山西青年 2018(17)
    • [20].小句补语句小句主语语义角色探析[J]. 文存阅刊 2018(17)
    • [21].基于多策略的藏语语义角色标注研究[J]. 中文信息学报 2014(05)
    • [22].基于语义角色的中文事件识别[J]. 计算机工程与科学 2013(04)
    • [23].基于图模型的语义角色标注重排序[J]. 中文信息学报 2013(05)
    • [24].通用语义角色自动标注研究[J]. 长春工业大学学报(自然科学版) 2012(02)
    • [25].基于语义角色标注的问答系统的研究与实现[J]. 计算机与数字工程 2012(07)
    • [26].语义角色标注研究综述[J]. 山东理工大学学报(自然科学版) 2011(06)
    • [27].汉语框架语义角色的自动标注[J]. 软件学报 2010(04)
    • [28].把字句主语的语义角色[J]. 贵阳学院学报(社会科学版) 2010(02)
    • [29].语义角色标注中特征优化组合研究[J]. 计算机应用与软件 2009(05)
    • [30].基于深度神经网络的语义角色标注[J]. 中文信息学报 2018(02)

    标签:;  ;  ;  ;  

    汉语框架语义角色自动标注研究
    下载Doc文档

    猜你喜欢