特征结构及其汉语语义资源建设

特征结构及其汉语语义资源建设

论文摘要

汉语语义分析,特别是大规模真实文本的语义分析,一直是当前自然语言处理的难点。传统依存分析法等标注方法在处理汉语特殊句型和特殊语言现象如主谓谓语句、连动句等句型时遇到一系列难题。基于语义方法建构的标注语料库,是自然语言处理基础研究和应用技术研究的基础。本文为汉语提出了一个语义分析模型——“特征结构”,并基于特征结构模型,并进一步运用特征结构模型分析了汉语语言学界争议较大的特殊句式(主谓谓语句、连动句等)。研究结果表明,特征结构模型在分析汉语语句时,比传统依存分析法能包含更多的语义关联,并能在语言学理论研究范围内解释汉语特殊句型的范围、类型及其特点等疑难问题。本研究为中文信息处理提供了一种语义分析方法,也提供了一个可以为各大研究机构共享的汉语句子级语义资源;同时也为汉语语言学理论中某些问题的解释提供了一个别样的视角。全文分六章,主要内容及观点如下:第一章:引论。主要包括课题研究背景、国内外研究现状分析、研究对象界定、研究内容等内容。第二章:特征结构模型。主要包括特征结构模型的界定,特征结构的特点:用特征三元组反映概念关联和关联种类,特征三元组允许多重关联和交叉关联,特征三元组允许嵌套和递归。特征结构的形式化表示为特征结构图,是一个可递归的无向图。特征结构的判定方法是基于提问的方法,研究了各种句式中提问的条件、提问针对的成分以及特征词在其中的分布等。在大规模真实语料中,特征结构三元组的类型可以分为六类。第三章:汉语特征结构资源建设。本语料库的语料来源于宾州中文树库的生语料、国内近三年中文新闻语料以及中小学语文课本。标注方式采用人工标注和计算机标注软件相结合的方法。设计并编写了汉语语义资源标注软件“语言标注平台”。研究了特征结构的判定标准。本章重点在于提出了详细地特征结构标注标准。第四章:主谓谓语句的特征结构研究。本章首先回顾了语言学界对主谓谓语句的研究成果和争论内容,根据汉语主谓谓语句的语法特点,分析了面向自然语言处理时的标注难点,然后运用特征结构模型对语言学界讨论过的十三种类型的主谓谓语句进行了细致的语义描述和分析,总结出了六种语义模型。将现有的传统依存分析方法和特征结构分析方法对主谓谓语句的分析结果进行了对比,结果表明,特征结构分析方法包含了更多的语义信息。第五章:连动句的特征结构研究。本章首先回顾了语言学界对连动句的研究成果和争论焦点,总结了汉语连动句的语法特点,然后分析了面向自然语言处理时连动句的标注难点。运用特征结构模型对语言学界讨论较多的16个连动句分别进行了细致地语义描述和分析,总结出了四类语义模型。将现有的传统依存分析方法和特征结构分析方法对连动句的分析结果进行了对比,结果表明,传统依存语法无法表示连动句中主语和除第一个谓语动词之外的其他谓语动词之间的语义关系,无法表示连动句中某个谓语动词的宾语与其他谓语动词之间的语义关系,也无法准确表示两个或多个谓语动词之间的语义关系。与传统依存分析法相比,特征结构模型能够描述更多的语义关系对,因此包含更加丰富的语义信息。另外,特征结构模型能够对传统依存分析法不能解释的语言现象做出解释,比如对连动句句式的判定、对连动句和紧缩复句的区分、对复杂的杂糅句式的语义分析等。特征结构模型在一定程度上推进了语言学理论的深化和发展,也为面向汉语的自然语言处理提供了一种新颖的语义分析方法。第六章:总结。包括评估、研究特色、应用价值、下一步研究计划等内容。本文主要创新点在以下三方面:(一)提出特征结构模型,探讨汉语语句的语义表示机制。(二)基于特征结构模型,对汉语语句进行语义标注,探寻适合汉语独特特点的语义分析方法和标注标准。(三)运用特征结构模型探讨了汉语特殊句型的语义分析方案,并尝试以新的视角来解释语言学理论中的争议问题。

论文目录

  • 博士生自认为的论文创新点
  • 中文摘要
  • Abstract
  • 第一章 引论
  • 1.1 研究背景
  • 1.2 国内外研究现状及分析
  • 1.3 存在问题
  • 1.4 本文研究内容和研究对象
  • 1.5 研究方法
  • 1.6 本文结构
  • 第二章 特征结构模型
  • 2.1 语义关联与关联种类
  • 2.2 特征结构特点
  • 2.3 特征结构的形式化表示
  • 2.4 特征结构的判定
  • 2.5 特征结构三元组的类型
  • 2.6 小结
  • 第三章 汉语特征结构资源建设
  • 3.1 语料来源
  • 3.2 标注方式
  • 3.3 标注软件
  • 3.4 特征结构的判定标准
  • 3.5 标注标准
  • 3.6 小结
  • 第四章 主谓谓语句特征结构研究
  • 4.1 引言
  • 4.2 语言学界主谓谓语句研究
  • 4.3 NLP中主谓谓语句语义标注难点所在和问题分析
  • 4.4 主谓谓语句的特征结构标注
  • 4.5 主谓谓语句的特征结构类型
  • 4.6 不同理论的主谓谓语句标注分析比较
  • 4.7 结论
  • 第五章 连动句特征结构研究
  • 5.1 引言
  • 5.2 语言学界连动句研究
  • 5.3 NLP中连动句语义标注难点所在和问题分析
  • 5.4 连动句的特征结构标注
  • 5.5 连动句的特征结构类型
  • 5.6 不同理论的连动句标注分析比较
  • 5.7 结论
  • 第六章 总结
  • 6.1 资源库数据
  • 6.2 评估
  • 6.3 本文的研究特色
  • 6.4 本研究的应用价值
  • 6.5 下一步的研究计划
  • 参考文献
  • 攻读博士学位期间的代表性科研成果
  • 后记
  • 相关论文文献

    • [1].从英汉形合与意合论四、六级连动句式英译技巧[J]. 校园英语 2017(10)
    • [2].汉语连动句研究前史[J]. 汉语国际教育研究 2016(00)
    • [3].一种基于规则和统计的连动句识别方法[J]. 电子设计工程 2017(22)
    • [4].原型理论启发下的现代汉语连动句类型研究[J]. 上海理工大学学报(社会科学版) 2012(01)
    • [5].连动句式汉英差异在高考中的考察研究[J]. 海外英语 2016(02)
    • [6].从析句目的角度考察现代汉语连动句(一)——对汉语连动句进行析句目的考察的背景[J]. 文教资料 2010(28)
    • [7].从析句目的角度考察现代汉语连动句(三)——从析句目的角度考察连动句典型实例[J]. 今日南国(中旬刊) 2010(10)
    • [8].“动词相连”还是“动作相承”——从现代汉语教材中连动句的范围说起[J]. 汉语国际教育研究 2020(00)
    • [9].从析句目的角度考察现代汉语连动句(四)——对争议例句的析句目的考察[J]. 考试周刊 2011(04)
    • [10].从析句目的角度考察现代汉语连动句(二)——从析句目的角度考察汉语连动句的必要性[J]. 文教资料 2010(29)
    • [11].连动句的时态解读机制[J]. 现代外语 2018(04)
    • [12].关于连动句中连动项之间的语义关系分析[J]. 宿州教育学院学报 2008(05)
    • [13].逻辑语义学视野下汉语意合性问题探索——以汉语否定式连动句为例[J]. 语言历史论丛 2016(00)
    • [14].浅谈连动句与兼语句的汉日互译[J]. 散文百家(新语文活页) 2019(08)
    • [15].关于连动句时序特征形式的语义探讨[J]. 参花(下) 2019(09)
    • [16].对外汉语教学中对兼语句和连动句认识的发展——兼议两种句式的存废问题[J]. 汉语应用语言学研究 2017(00)
    • [17].汉语连动句题元结构的形式语义分析[J]. 语言历史论丛 2013(00)
    • [18].连动结构的定义和语义[J]. 艺术科技 2019(10)
    • [19].从《水浒传》的连动句英译看“中国英语”[J]. 广东外语外贸大学学报 2019(01)
    • [20].“被”字连动句中动词的排列组合规律[J]. 华北水利水电学院学报(社科版) 2011(03)
    • [21].也谈连动句中动词的顺序问题[J]. 语文学刊 2010(12)
    • [22].汉语连动句的英译——以《寿县概况》的英译为例[J]. 科教文汇(上旬刊) 2019(06)
    • [23].如此缩句何时休[J]. 小学教学设计 2014(07)
    • [24].分析“连动句”句式及对外汉语教学[J]. 智库时代 2019(05)
    • [25].纳苏彝语连动结构研究[J]. 红河学院学报 2018(01)
    • [26].从词组本位观看连动结构的特殊性[J]. 湖北大学学报(哲学社会科学版) 2017(05)
    • [27].连动句中连动项之间存在多种语义关系的分析[J]. 内蒙古师范大学学报(哲学社会科学版) 2013(06)
    • [28].缩句≠抓句子的主、谓、宾[J]. 小学语文教学 2008(08)
    • [29].快乐一家子[J]. 班主任之友(小学版) 2011(11)
    • [30].汉语共宾连动结构的句法分析[J]. 淮南师范学院学报 2018(05)

    标签:;  ;  ;  ;  ;  ;  

    特征结构及其汉语语义资源建设
    下载Doc文档

    猜你喜欢