基于层叠条件随机场的汉语句法分析技术的研究

基于层叠条件随机场的汉语句法分析技术的研究

论文摘要

汉语句法分析是中文信息处理的关键技术,是对汉语进行深层次理解的基础。句法分析性能的提高对于机器翻译、信息检索、信息抽取等应用技术性能的提高都会有巨大的推动作用。目前汉语句法分析技术还不能满足中文信息处理的要求,所以对汉语句法分析的研究具有重要的实际意义。本文提出了一种基于最长名词短语前处理的统计句法分析方法,将最长名词短语的识别与分析从句法分析中独立出来,同时使用基于语料库的统计学习方法,对汉语句法分析技术进行了探索。本文工作分三部分进行,具体内容如下:首先,进行了对最长名词短语的分析工作。最长名词短语是名词短语中最重要的一类,它的识别与分析可以更好的帮助人们理解自然语言中的句子。由于传统的句法分析对最长名词短语的处理不够理想,本文对最长名词短语进行专门处理,以降低句法分析的复杂度。根据汉语最长名词短语的句法特点,本文提出了一种基于chunk parsing的最长名词短语分析方法,有效的提高了最长名词短语的分析效果,解决了最长名词短语对句法分析的影响。其次,提出了一种基于层叠条件随机场模型的汉语句法分析方法。与用一个单一模型来识别所有短语的方法不同,该方法将句法分析过程分解为两个阶段:一是句子中句法单元的识别,二是句法单元之间关系的分析。这样可以对不同的子问题选用不同的模型和搜索策略进行处理,同时也降低了句子分析的难度。本文选用层叠条件随机场作为多层分析模型。最后,在解码方式上本文使用局部最优化的搜索算法对句子进行解码。该算法利用广度优先策略寻找局部最优解,很好地缓解了传统确定性分析算法中的错误蔓延问题。在第一届汉语句法分析评测的数据集上进行了实验,实验结果表明基于层叠条件随机场的汉语句法分析方法显著提高了句法分析的精确率和召回率,有效降低了句法分析的复杂度,使系统处理文本的速度得到了提高。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 句法分析和句法分析树
  • 1.2 课题的提出和意义
  • 1.2.1 短语结构文法
  • 1.2.2 基于统计的汉语句法分析方法
  • 1.3 本文的工作
  • 1.4 论文的组织
  • 第2章 相关研究工作
  • 2.1 基于规则的方法
  • 2.2 基于统计的方法
  • 2.2.1 句法分析模型的研究
  • 2.2.2 句法分析搜索算法的研究
  • 2.2.3 树库资源建设
  • 2.3 本章小结
  • 第3章 基于 chunk parsing 的最长名词短语分析
  • 3.1 引言
  • 3.2 最长名词短语的结构特点
  • 3.3 汉语最长名词短语分析
  • 3.3.1 最长名词短语的分析任务
  • 3.3.2 条件随机场模型
  • 3.3.3 汉语最长名词短语的结构分析框架
  • 3.3.4 特征选择
  • 3.3.5 基于规则的后处理模块
  • 3.4 实验结果与分析
  • 3.4.1 语料准备
  • 3.4.2 最长名词短语结构分析实验
  • 3.4.3 对比实验
  • 3.5 本章小结
  • 第4章 基于层叠条件随机场模型的汉语句法分析
  • 4.1 引言
  • 4.2 句子框架的生成
  • 4.3 基于分治策略的句法分析方法
  • 4.4 组块的结构特点
  • 4.5 组块的识别方法
  • 4.6 层叠条件随机场模型
  • 4.7 特征选择
  • 4.8 实验结果及分析
  • 4.8.1 实验准备
  • 4.8.2 语料预处理
  • 4.8.3 MNP 识别的特征选择
  • 4.8.4 低层组块识别实验
  • 4.8.5 句法分析实验
  • 4.9 本章小结
  • 第5章 基于局部优化的搜索算法
  • 5.1 引言
  • 5.2 算法描述
  • 5.3 实验结果与分析
  • 5.4 本章小结
  • 第6章 系统设计与实现
  • 6.1 系统设计
  • 6.1.1 系统框架
  • 6.1.2 系统流程
  • 6.2 实验结果
  • 6.2.1 句法分析实验结果
  • 6.3 本章小结
  • 结论
  • 附录Ⅰ TCT 树库词性标注集
  • 附录Ⅱ TCT 树库短语标注集
  • 参考文献
  • 致谢
  • 攻读硕士期间发表(含录用)的学术论文及科研成果
  • 相关论文文献

    • [1].汉语句法实现中的生命度效应及其产生原因[J]. 云南师范大学学报(对外汉语教学与研究版) 2016(06)
    • [2].从歧义分化看汉语句法分析方法的拓展演变[J]. 青年文学家 2013(32)
    • [3].汉语句法中的同义现象[J]. 黑河学院学报 2020(08)
    • [4].《跨语言视角下的汉语句法学》介评[J]. 外语教学与研究 2017(02)
    • [5].向心结构理论难题与其诠释汉语句法的局限性[J]. 语文学刊 2014(02)
    • [6].汉语句法中折射的文化因素与对外汉语教学[J]. 中国科教创新导刊 2013(20)
    • [7].汉语话题结构与句法的灵活性[J]. 外语艺术教育研究 2009(01)
    • [8].汉语句法省略国际学术研讨会征稿启事[J]. 汉语学报 2018(01)
    • [9].汉语句法象似性与对外汉语语法教学[J]. 赤峰学院学报(汉文哲学社会科学版) 2013(07)
    • [10].汉语句法省略问题国际学术研讨会征稿启事[J]. 汉语学习 2018(02)
    • [11].汉语句法省略国际学术研讨会征稿启事[J]. 古汉语研究 2018(02)
    • [12].从汉语句法结构角度分析母语迁移现象对外语学习的影响[J]. 天津中德职业技术学院学报 2015(01)
    • [13].汉语句法省略国际学术研讨会征稿启事[J]. 语言研究 2018(02)
    • [14].从《汉语句法引论》得到的启发[J]. 现代语文(学术综合版) 2012(08)
    • [15].从歧义分化看汉语句法分析方法的拓展演变[J]. 湘潮(下半月) 2010(11)
    • [16].英汉语句法对比综述[J]. 校园英语 2019(14)
    • [17].《汉语句法的类型转变》述评[J]. 当代语言学 2010(03)
    • [18].语言理解中汉语句法启动的“词汇增益”研究——来自眼动的证据[J]. 外语学刊 2020(04)
    • [19].汉语句法启动研究综述[J]. 青年文学家 2018(29)
    • [20].汉语句法省略国际学术研讨会征稿启事[J]. 世界汉语教学 2018(02)
    • [21].“汉语句法省略问题”国际学术研讨会征稿启事[J]. 语文研究 2018(02)
    • [22].格语法与汉语句法研究[J]. 赤峰学院学报(汉文哲学社会科学版) 2009(01)
    • [23].《改革开放以来英语对汉语句法的影响》商榷三题[J]. 通化师范学院学报 2020(03)
    • [24].移位理论对汉语句法结构的解释[J]. 南华大学学报(社会科学版) 2010(04)
    • [25].论现代汉语句法的欧化[J]. 现代语文(语言研究版) 2016(06)
    • [26].论欧化的汉语句法[J]. 语文学刊 2010(24)
    • [27].从“叫”的个案讨论汉语句法格局的形成方式[J]. 语文研究 2017(01)
    • [28].从虚词看古汉语句法的空间蕴涵性特质——与英语对比的视角[J]. 重庆三峡学院学报 2020(02)
    • [29].汉语句法研究新图景——评Waltraud Paul教授的《汉语句法新视角》[J]. 北京第二外国语学院学报 2018(01)
    • [30].《汉语句法的认知结构研究》(修订版)[J]. 读书 2016(08)

    标签:;  ;  ;  ;  

    基于层叠条件随机场的汉语句法分析技术的研究
    下载Doc文档

    猜你喜欢