汉语动词名物化复合结构的语义解释

汉语动词名物化复合结构的语义解释

论文摘要

网络信息和信息检索在人们日常生活中已成为不可或缺的组成部分,语言文字占据信息形式上的绝大多数,实际上关注的是语言形式所承载的内容信息,本质上都涉及自然语言的语义概念。自然语言成分结构间的语义关系计算问题是自然语言理解的关键,其本质在于计算语言结构与语言语义之间的对应关系。如何寻找新的思路及其理论和方法,使得语言的结构和语义尽量能同构对应,尤其是适应动态地计算语言复合结构的概念意义,具有重要的理论研究意义和广阔的应用前景。尽管语言表达有句、短语等多种形式,但从概念分析角度看都可归结到词汇概念间的组合叠置。这与当前国内外语言学聚焦于词汇理论相一致。复合结构是一种由若干个名词性词汇直接组合而成,在整体上相当于一个新的名词性词汇的语言结构形式。和短语、句等语言结构不同,复合结构的构成缺乏功能标记,这对其语义计算形成很大障碍,实际上成为语义计算的一个瓶颈问题。本文主要解决汉语中动词名物化进入复合结构时的语义解释问题。研究的起点是从实例分析出发,剖析以往语法研究中的不足,标引复合结构子成分之间的概念关系,归纳复合结构中概念耦合的内在特点以及多语种表达式在复合结构这一层次上存在自然对齐的潜在可能性。首先,作为数据准备工作,研究了动词名物化复合结构的识别;然后,分别构建了两种基本动词名物化复合结构(NV型和VN型)的语义解释模型;最后,还探讨了属性知识在复合结构语义解释中的应用。具体来讲,本文的创新性工作有以下几点:一、提出了一种基于主题词表和万维网的复合结构识别方法。为了有效地解决汉语中名词和动词组合时的结构歧义问题,构造了两个新的分类特征集合:词汇复合能力和指称模板特征。特征的获取使用了两个独立的资源:主题词表和万维网,其好处在于不依赖于复合结构出现的具体上下文,可以用于对文档中的低频复合结构进行识别,而这是以往的识别模型所无法解决的问题。机器学习实验表明,两个新特征集极大的改善了动词名物化复合结构识别的性能。二、归纳了汉语NV型复合结构中涉及的语义关系,构建了一个基于词汇语法模板的复合结构语义解释模型。模型定义了新的词汇模板形式:功能词例化模板,并将其作为分类特征,对复合结构词汇间的语义关系进行标注。模型的主要优点是其对资源的依赖性很低,以往的方法主要利用词汇本体和句法语料,而该模型则使用纯文本语料来获取复合结构的分类特征,从而使得模型的适用性和可移植性大大增强。实验表明,基于功能词例化模板的模型取得了很好的性能。三、提出了汉语VN型复合结构的语义关系标注集,并设计了一个机器翻译驱动的复合结构语义解释模型。基于复合结构的多语种自然同构假设,模型首先将汉语复合结构自动翻译为对齐的英文复合结构,然后将英文复合结构作为附加信息,用于对汉语的复合结构进行解释。模型的主要优点是可以利用跨语种的资源,对多语种的对齐复合结构同时进行语义解释,从而可以在某种程度解决某些语种中的资源缺乏问题。实验证实,双语语义解释模型的性能要好于单语模型。四、构建了一个属性知识库的获取框架。词汇概念可以被描述为属性和属性值的集合,属性知识对于复合结构语义解释非常重要。属性获取分为两个阶段,一个阶段是属性词的获取,一个阶段是属性宿主的求取。在属性词的获取中,设计了一个机读词典和万维网的协同自举算法。算法充分利用了汉语的义符构词特点,并结合了机读词典和万维网作为属性知识的来源,对属性词进行获取。而针对属性宿主的求取,则将其视为一个选择约束求解问题,通过评估属性与可能的概念类之间的选择关联度来确定属性的宿主。该方法的特点在于其可以动态、高效地获取以属性词为中心的词汇知识。五、利用所获取的属性知识,提出了一种基于属性词的词汇相似度计算模型。与以往基于词汇层级知识体系的相似度计算方法不同,该模型充分利用了词汇概念所可能具有的属性词信息来对词汇概念进行表征。属性词可以对概念的各个不同方面进行刻画,如果两个词汇概念共享的关键属性信息越多,则两个词汇概念越为相似,从而,用属性词向量表示词汇概念可以更加精细的刻画词汇概念之间的区分程度。在标准数据集评测以及复合结构语义解释的应用上,该模型取得了比其他词汇相似度模型更好的性能。

论文目录

  • 摘要
  • ABSTRACT(英文摘要)
  • 第一章 绪论
  • 1.1 问题描述
  • 1.1.1 复合结构
  • 1.1.2 动词名物化复合结构
  • 1.1.3 复合结构的语义解释
  • 1.2 复合结构语义解释的研究现状
  • 1.2.1 知识驱动的语义解释模型
  • 1.2.1.1 溯因推理
  • 1.2.1.2 槽填充理论
  • 1.2.1.3 属性结构及合一运算
  • 1.2.1.4 生成词汇学及互组合运算
  • 1.2.2 数据驱动的语义解释模型
  • 1.2.2.1 基于句法语料的模型
  • 1.2.2.2 基于词汇本体的模型
  • 1.2.3 主要模型间的比较
  • 1.3 本文的主要研究内容
  • 第二章 动词名物化复合结构的识别
  • 2.1 引言
  • 2.2 相关工作
  • 2.3 最大熵模型
  • 2.4 特征函数的选取
  • 2.4.1 上下文特征
  • 2.4.2 基于主题词表的词汇复合能力特征
  • 2.4.3 基于万维网的指称模板特征
  • 2.4.3.1 指称词汇模板集
  • 2.4.3.2 万维网作为超大规模语料库
  • 2.4.3.3 基于万维网的点式互信息
  • 2.4.3.4 CAIM特征离散化
  • 2.5 实验及结果分析
  • 2.5.1 数据集
  • 2.5.2 基准系统及其性能
  • 2.5.3 词汇复合能力特征对系统性能的影响
  • 2.5.4 指称模板特征对系统性能的影响
  • 2.5.5 系统的最优性能
  • 2.5.6 与其他分类器的对比
  • 2.6 本章小结
  • 第三章 NV复合结构的语义解释
  • 3.1 引言
  • 3.2 相关工作
  • 3.2.1 NV复合结构的语法关系标注
  • 3.2.2 广义名物化短语的语义角色标注
  • 3.2.3 语义关系抽取
  • 3.3 NV复合结构涉及的语义关系
  • 3.4 基于手工词汇模板的语义解释模型
  • 3.5 基于自动词汇模板的语义解释模型
  • 3.5.1 功能词例化模板
  • 3.5.2 FLP模板库构建
  • 3.5.3 FLP向量计算
  • 3.5.4 模板过滤
  • 3.6 实验与结果分析
  • 3.6.1 数据集
  • 3.6.2 基准系统
  • 3.6.2.1 基准模型1
  • 3.6.2.2 基准模型2
  • 3.6.3 手工词汇模板模型性能
  • 3.6.4 自动词汇模板模型性能
  • 3.6.5 模型间性能对比
  • 3.7 本章小结
  • 第四章 VN复合结构的语义解释
  • 4.1 引言
  • 4.2 相关工作
  • 4.2.1 使用非平行语料库的词汇翻译
  • 4.2.2 复合结构的机器翻译
  • 4.2.3 双语附加信息消岐
  • 4.3 VN复合结构涉及的语义关系
  • 4.4 模型构建的依据
  • 4.4.1 复合结构多语种自然同构性假设
  • 4.4.2 复合结构语义解释中的1 + 1 < 1假设
  • 4.5 算法描述
  • 4.5.1 系统框架
  • 4.5.2 VN复合结构汉英翻译
  • 4.5.2.1 翻译候选生成
  • 4.5.2.2 翻译选择
  • 4.5.3 双语语义解释模型
  • 4.5.3.1 双语复合结构相似度计算
  • 4.5.3.2 语义关系标注
  • 4.5.3.3 实例分析
  • 4.6 实验结果及分析
  • 4.6.1 数据集
  • 4.6.2 复合结构翻译结果
  • 4.6.3 语义关系标注结果
  • 4.7 本章小结
  • 第五章 属性知识库的自动构建
  • 5.1 引言
  • 5.2 相关工作
  • 5.2.1 基于机读词典的词汇知识获取
  • 5.2.2 基于语料库的词汇知识获取
  • 5.2.3 属性知识获取
  • 5.3 属性及其宿主
  • 5.4 系统描述
  • 5.4.1 系统框架
  • 5.4.2 属性获取
  • 5.4.2.1 基本属性集获取
  • 5.4.2.2 属性过滤
  • 5.4.2.3 属性扩展
  • 5.4.3 属性宿主求取
  • 5.5 实验结果及分析
  • 5.5.1 属性获取结果
  • 5.5.1.1 属性过滤阈值训练
  • 5.5.1.2 基本属性集获取结果
  • 5.5.1.3 封闭式属性扩展结果
  • 5.5.1.4 开放式属性扩展结果
  • 5.5.2 宿主求取结果
  • 5.6 本章小结
  • 第六章 属性知识库在复合结构语义解释中的应用
  • 6.1 引言
  • 6.2 相关工作
  • 6.2.1 基于知识的词汇相似度计算
  • 6.2.2 基于语料库的词汇相似度计算
  • 6.3 基于属性知识的词汇相似度计算
  • 6.3.1 算法思想及框架
  • 6.3.2 属性词向量获取
  • 6.3.3 属性词的选择约束强度加权
  • 6.3.4 属性向量相似度计算
  • 6.4 实验及结果分析
  • 6.4.1 Miller-Charles数据集
  • 6.4.2 基准算法
  • 6.4.3 不同算法在M&C数据集上的性能对比
  • 6.4.4 在复合结构语义解释上的性能对比
  • 6.5 本章小结
  • 第七章 结论
  • 7.1 总结
  • 7.2 展望
  • 参考文献
  • 致谢
  • 博士期间的研究成果及发表的论文
  • 相关论文文献

    • [1].英语专业本科生名物化习得实证研究[J]. 智库时代 2019(33)
    • [2].医学论文英文摘要的名物化现象研究[J]. 长春大学学报 2018(01)
    • [3].名物化语言现象在语篇中的作用[J]. 现代外语 2016(06)
    • [4].政治文本英译中的名物化及其意识形态动因研究——以2015年《中国军事战略》为例[J]. 解放军外国语学院学报 2016(06)
    • [5].浅析英语科学论文写作中的名物化运用[J]. 内江科技 2017(09)
    • [6].商务话语名物化研究新进展——《商务话语名物化研究》评介[J]. 中国外语研究 2018(01)
    • [7].语法隐喻以及浅析名物化现象[J]. 课程教育研究 2015(23)
    • [8].名物化学习实证研究述评[J]. 中国ESP研究 2016(01)
    • [9].口译实践中的去名物化研究[J]. 校园英语 2017(13)
    • [10].英文新闻报道中名物化的纯理功能分析[J]. 华西语文学刊 2016(01)
    • [11].广告英语中的名物化隐喻解读[J]. 现代企业教育 2011(08)
    • [12].对英语名物化的功能分析[J]. 科技展望 2016(10)
    • [13].基于语料库的英语专业研究生学位论文中的名物化现象研究[J]. 大家 2012(04)
    • [14].以某语篇为例分析英语名物化的语篇功能[J]. 边疆经济与文化 2013(08)
    • [15].阿美语名物化的途径[J]. 民族语文 2012(02)
    • [16].名物化隐喻与经验的重构[J]. 江苏科技大学学报(社会科学版) 2011(02)
    • [17].名物化隐喻的动态语义分析[J]. 长春师范学院学报(人文社会科学版) 2009(05)
    • [18].大学英语写作中名物化教学策略研究[J]. 海外英语 2017(23)
    • [19].中英科技文摘要中名物化使用对比研究[J]. 智库时代 2018(23)
    • [20].英语写作中名物化意识和能力培养的实证研究[J]. 教学与管理 2011(06)
    • [21].从功能语法的角度谈英文医学论文中的名物化现象[J]. 外语与外语教学 2008(09)
    • [22].英译法的汉语名物化差异性研究[J]. 校园英语 2016(34)
    • [23].《论名物化》概述[J]. 北方文学 2018(17)
    • [24].旅游宣传文本英译汉中名物化词组的语言特点及其翻译策略[J]. 科教导刊(上旬刊) 2018(08)
    • [25].新闻编译中的名物化改动与意识形态转换[J]. 中国翻译 2015(03)
    • [26].汉语名物化复合词识别[J]. 计算机应用与软件 2008(09)
    • [27].英语语篇名物化现象研究的知识图谱可视化分析——基于对国内外核心期刊文献数据的考察[J]. 东莞理工学院学报 2018(06)
    • [28].从功能语法视角看英语名物化现象[J]. 剑南文学(经典教苑) 2012(05)
    • [29].英文产品说明书中名物化结构的汉译[J]. 陇东学院学报 2011(06)
    • [30].从语法隐喻视角看英文表达中的名物化现象——以新闻文体为例[J]. 文化创新比较研究 2018(11)

    标签:;  ;  ;  ;  ;  

    汉语动词名物化复合结构的语义解释
    下载Doc文档

    猜你喜欢