基于渡越矩阵与语境计算模型的复句关系词的自动标注

基于渡越矩阵与语境计算模型的复句关系词的自动标注

论文摘要

自然语言理解是人工智能领域的经典难题,目前国内外有大量的研究。在汉语信息处理领域,相应的研究应该包括有字处理、词处理、句处理、篇章处理。然而到目前为止,关于汉语理解的研究基础比较薄弱,汉语信息处理的研究基本上还停留在“字和词处理”阶段,大多数研究成果都是基于字和词的研究。对于句子的研究尤其是汉语复句的计算机处理相对要少一些。这可能与汉语的难度有关,因为汉语与西方语言不同,它语法和语义都很灵活,没有形态。汉语的句子从结构上可以划分为单句和复句两大类,复句的意义容量比一般单句大,常表示人和人、事和事及人与物的逻辑意义关系。复句一般由分句构成,各分句单独从其结构上看实际上就是小句。复句本身有其复杂且特殊的结构,复句是小句的联结,作为一种语法实体,它下连小句,上连篇章,在单句和篇章之间起到了一个很好的衔接作用,同时兼有语法、语义和语用等多方面的属性。复句的层次关系从某种意义上来说就是复句的灵魂,复句关系词的标识对复句的层次关系起着重要的作用,随着对复句研究的深入,复句关系词的作用显得越来越重要,如何有效地对复句关系词进行标注就显得迫切和重要。本文首先介绍了关于复句领域的一些相关概念和知识,接着介绍了复句关系词的相关知识,并介绍了标注复句关系词的基于规则的方法,基于概率统计的渡越矩阵方法和基于语境计算模型的复句关系词的标注方法。综合利用这些方法能够对汉语中复句关系词进行有效的标注。

论文目录

  • 中文摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 论文的研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 现有的关系词研究
  • 1.2.2 现有的关系词自动标注方法
  • 1.3 本文的主要研究内容与方法
  • 1.4 论文的章节安排
  • 第二章 基于规则的复句关系词的自动标注
  • 2.1 复句关系词的分析
  • 2.1.1 复句关系词的性质
  • 2.1.2 复句关系词的范围
  • 2.1.3 复句关系词的分类模型
  • 2.2 规则库的建立和使用
  • 2.2.1 标注规则简介
  • 2.2.2 规则库的构建决策
  • 2.2.3 规则库的建立
  • 2.2.4 规则库的使用
  • 2.3 利用规则对复句中关系词进行自动标注
  • 2.3.1 相关背景
  • 2.3.2 标注过程
  • 2.3.3 试验结果及分析
  • 2.4 本章小结
  • 第三章 基于渡越矩阵的复句关系词的自动标注
  • 3.1 渡越矩阵的使用背景
  • 3.2 渡越矩阵识别的整体结构
  • 3.3 渡越矩阵的建立
  • 3.3.1 关系词特征的选择
  • 3.3.2 渡越矩阵的原理
  • 3.3.3 渡越矩阵中概率的获取
  • 3.4 利用渡越矩阵进行标注
  • 3.4.1 试验结果及分析
  • 3.5 本章小结
  • 第四章 基于语境计算模型的复句关系词的自动标注
  • 4.1 语境计算模型的标注原理
  • 4.2 语境计算模型的标注方法
  • 4.3 利用语境计算模型处理关系词
  • 4.4 本章小结
  • 第五章 结论与展望
  • 5.1 全文总结
  • 5.2 展望
  • 参考文献
  • 在校期间发表的论文、科研成果等
  • 致谢
  • 相关论文文献

    • [1].中国中文信息学会第八次全国会员代表大会暨学会成立35周年学术会议在京成功举办[J]. 中文信息学报 2017(01)
    • [2].中文信息处理与汉字表征码——划时代的革命性创新技术[J]. 创新时代 2013(01)
    • [3].菲律宾华裔青少年学习中文信息处理的研究[J]. 电脑知识与技术 2019(25)
    • [4].董振东:知网发明人[J]. 中国老年 2019(10)
    • [5].周有光关于中文信息处理的思想研究[J]. 常州工学院学报(社科版) 2014(02)
    • [6].中文信息处理的主流技术[J]. 科技创新导报 2009(24)
    • [7].中国中文信息学会2017学术年会暨理事会在深圳成功召开[J]. 中文信息学报 2017(06)
    • [8].创新 让中文昂首走向世界——记华兴初划时代的新技术“中文信息处理与汉字表征码”[J]. 中国高校科技 2014(S1)
    • [9].共和国的中文信息处理60年[J]. 语言文字应用 2009(03)
    • [10].中文计算技术的最新进展——第七届中文信息处理国际会议综述[J]. 长江学术 2008(01)
    • [11].中文信息处理歧义问题研究[J]. 散文百家 2018(02)
    • [12].浅谈中文信息处理跨文本指代消解研究[J]. 电脑知识与技术 2013(15)
    • [13].中国中文信息学会2018学术年会暨理事会暨“钱伟长中文信息处理科学技术奖”颁奖大会在京召开[J]. 中文信息学报 2018(12)
    • [14].基于中文信息处理的现代汉语三音词研究[J]. 河南理工大学学报(社会科学版) 2009(04)
    • [15].中国中文信息学会战略研讨会在贵州贵阳成功召开[J]. 中文信息学报 2014(02)
    • [16].中国中文信息学会2019学术年会暨理事会在昆明成功召开[J]. 中文信息学报 2019(11)
    • [17].中文信息处理下句法分析之发展前景卮言[J]. 才智 2018(31)
    • [18].张普教授逝世[J]. 世界汉语教学 2018(02)
    • [19].关于申报2018年中国中文信息学会科学技术奖——“钱伟长中文信息处理科学技术奖”的通知[J]. 中文信息学报 2018(03)
    • [20].基于主题的微博小句内评价对象与评价词分析[J]. 现代语文(语言研究版) 2016(03)
    • [21].中国中文信息学会颁发2014年度“钱伟长中文信息处理科学技术奖”“汉王青年创新奖”及“拓尔思优秀博士学位论文奖”[J]. 中文信息学报 2015(01)
    • [22].中文信息处理中自动分词技术的研究与展望[J]. 科技创新与应用 2015(25)
    • [23].传承华夏文化 创立民族品牌——记中国空空导弹研究院华兴初发明的汉字表征码中文信息处理技术[J]. 创新时代 2015(02)
    • [24].基于中文信息处理的汉语词汇逻辑语义分析——以“红+N”二字组合为例[J]. 常州工学院学报(社科版) 2014(05)
    • [25].中国中文信息学会[J]. 科协论坛 2018(12)
    • [26].基于中文信息处理的汉语词汇语义结构研究——以“高+N”二字组合为例[J]. 江苏科技大学学报(社会科学版) 2014(03)
    • [27].基于C#语音合成的实现[J]. 电脑编程技巧与维护 2010(12)
    • [28].基于条件随机场的古汉语词义消歧研究[J]. 微电子学与计算机 2009(10)
    • [29].手工分词和词性标注的问题[J]. 现代语文(语言研究版) 2010(07)
    • [30].基于注疏的先秦文献信息处理探索[J]. 常熟理工学院学报 2020(04)

    标签:;  ;  ;  ;  ;  

    基于渡越矩阵与语境计算模型的复句关系词的自动标注
    下载Doc文档

    猜你喜欢