基于支持向量机的汉语框架语义角色自动标注

基于支持向量机的汉语框架语义角色自动标注

论文摘要

近年来,自然语言研究的热点已经转到了语义角色标注上来。本文以汉语框架语义知识库为基础,结合汉语自身的特点,重点研究了汉语框架语义角色自动标注问题,为以后构建大规模的语料库,推动中文信息检索、自动问答、信息抽取等自然语言处理技术的发展,做出了有益的探索。由于汉语的完全句法分析器的性能达不到使用阶段,本文将汉语框架语义角色看做是以词为标注单位的序列标注问题,使用支持向量机作为分类器来训练模型,并将词层面特征和基本块层面特征融合到标注模型中。本文的语义角色标注任务为:给定目标词和目标词所属的框架,在句子中自动识别出框架元素并为其标上相应的框架语义角色。本文从汉语框架语义知识库中挑出25个框架作为实验语料,并在此实验语料上进行了3组2折交叉验证,最后用这3组2折交叉验证的均值作为我们模型的性能。实验中,我们首先为每类候选特征提供几种窗口大小,然后用正交表对特征及其窗口的大小进行选择。本文构建了两类语义角色标注模型:一类是基于词特征的语义角色标注,在把语义角色的识别和分类分开进行时,我们得到了59.65%的F值,把识别和分类联合起来进行实验时,我们得到的性能是58.72%;另一类是基于基本块特征的语义角色标注,在语义角色识别和分类分开进行时我们得到了59.67%的F值,识别和分类联合进行时得到了58.92%的F值。实验结果表明:(1)将语义角色标注分为两步进行比两步联合起来进行的性能要好;(2)加入基本块信息后,语义角色识别和分类的性能都有所提高,但提高不大;(3)两类模型都表现出了明显的高准确率低召回率的现象。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第1章 引言
  • 1.1 研究工作的目的和意义
  • 1.2 国内外研究现状
  • 1.3 本文的研究方法和内容
  • 1.4 论文结构安排
  • 第2章 相关理论介绍
  • 2.1 支持向量机
  • 2.1.1 两分类问题的相关理论
  • 2.1.2 常见的多分类方法
  • 2.2 交叉验证
  • 2.3 正交设计和正交表
  • 第3章 汉语框架网络及语义角色标注任务介绍
  • 3.1 汉语框架网络
  • 3.1.1 框架网络工程简介
  • 3.1.2 汉语框架网络工程介绍
  • 3.2 汉语框架语义角色标注任务
  • 3.3 本文所使用的工具包
  • 3.4 IBO2标注策略和评价准则
  • 第4章 基于词特征的语义角色自动标注
  • 4.1 语料的选取和切分
  • 4.2 特征描述及选取方法
  • 4.3 实验方案及后处理策略
  • 4.3.1 实验方案
  • 4.3.2 后处理策略
  • 4.4 一对一方法和一对多方法的比较
  • 4.5 实验几种方案及其实验结果
  • 4.5.1 不含通用语义角色的实验结果
  • 4.5.2 含通用语义角色的实验结果
  • 4.6 本章小结
  • 第5章 融合基本块特征的语义角色标注模型
  • 5.1 汉语基本块体系描述
  • 5.2 特征描述及选取方法
  • 5.3 实验几种方案及其实验结果
  • 5.3.1 不含通用语义角色实验结果
  • 5.3.2 含通用语义角色的实验结果
  • 5.4 实验结果分析
  • 5.5 本章小结
  • 第6章 总结与展望
  • 6.1 论文总结
  • 6.2 下一步研究计划
  • 参考文献
  • 附录A:山大973词性标注体系及其与清华大学词性映射关系
  • 附录B:实验用正交表及PB表
  • 攻读学位期间取得的研究成果
  • 致谢
  • 个人简况
  • 相关论文文献

    • [1].论元角色的藏语语义角色标注研究[J]. 高原科学研究 2018(03)
    • [2].基于规则的“把”字句语义角色标注[J]. 中文信息学报 2017(01)
    • [3].蒙古文语义角色研究概述[J]. 内蒙古师范大学学报(哲学社会科学版) 2014(06)
    • [4].中文语义角色标注研究概述[J]. 文教资料 2012(27)
    • [5].格语法视域下的汉语语序与语义角色关系探究[J]. 北京化工大学学报(社会科学版) 2018(04)
    • [6].《语义角色研究进展》述介[J]. 当代语言学 2019(04)
    • [7].一种规则与统计相结合的应用题句子语义角色识别方法[J]. 计算机应用研究 2018(08)
    • [8].语义角色理论述评[J]. 河南理工大学学报(社会科学版) 2018(04)
    • [9].基于语义角色标注的专利主题提取研究[J]. 图书情报工作 2014(19)
    • [10].基于分层输出神经网络的汉语语义角色标注[J]. 中文信息学报 2014(06)
    • [11].语义角色标注及其在科技情报分析中的应用研究[J]. 情报理论与实践 2015(01)
    • [12].基于依存特征的汉语框架语义角色自动标注[J]. 中文信息学报 2013(02)
    • [13].基于文献计量的国内语义角色标注研究现状分析[J]. 情报杂志 2012(04)
    • [14].基于特征组合的中文语义角色标注[J]. 软件学报 2011(02)
    • [15].基于语义角色标注的新闻领域复述句识别方法[J]. 中文信息学报 2010(05)
    • [16].中文问答系统中语义角色标注的研究与实现[J]. 科学技术与工程 2008(10)
    • [17].基于外部记忆单元和语义角色知识的文本复述判别模型[J]. 中文信息学报 2017(06)
    • [18].基于语义角色标注的文本水印算法[J]. 计算机应用研究 2017(04)
    • [19].小句补语句小句主语语义角色探析[J]. 山西青年 2018(17)
    • [20].小句补语句小句主语语义角色探析[J]. 文存阅刊 2018(17)
    • [21].基于多策略的藏语语义角色标注研究[J]. 中文信息学报 2014(05)
    • [22].基于语义角色的中文事件识别[J]. 计算机工程与科学 2013(04)
    • [23].基于图模型的语义角色标注重排序[J]. 中文信息学报 2013(05)
    • [24].通用语义角色自动标注研究[J]. 长春工业大学学报(自然科学版) 2012(02)
    • [25].基于语义角色标注的问答系统的研究与实现[J]. 计算机与数字工程 2012(07)
    • [26].语义角色标注研究综述[J]. 山东理工大学学报(自然科学版) 2011(06)
    • [27].汉语框架语义角色的自动标注[J]. 软件学报 2010(04)
    • [28].把字句主语的语义角色[J]. 贵阳学院学报(社会科学版) 2010(02)
    • [29].语义角色标注中特征优化组合研究[J]. 计算机应用与软件 2009(05)
    • [30].基于深度神经网络的语义角色标注[J]. 中文信息学报 2018(02)

    标签:;  ;  ;  

    基于支持向量机的汉语框架语义角色自动标注
    下载Doc文档

    猜你喜欢