基于概率上下文无关文法的汉语句法分析方法研究

基于概率上下文无关文法的汉语句法分析方法研究

论文摘要

句法分析是自然语言处理的一个基本问题。许多自然语言处理任务,比如机器翻译、信息获取、自动文摘等都要依赖句法分析的精确结果才能最终获得满意的解决。同时,句法分析中所使用的技术也有助于解决其他领域与句法分析相似的问题。另一方面,语言是人类思维的载体,对自然语言的研究有助于研究人类智慧的本质,在处理语言的过程中,句法分析也是人们所面临的一个基本问题。因此对自然语言句法分析的研究具有重要的理论价值和深刻的哲学意义。在基于统计的句法分析方法中,最关键的两个问题是句法分析歧义消解模型和句法分析算法的设计,他们决定着句法分析系统的分析正确率和效率。本文从事的工作则从这两方面入手,提出了一个基于PCFG的结合上下文信息的句法分析方法,主要研究工作如下:1.研究现有常用的统计句法分析模型和句法分析算法,并对其进行综合分析比较;2.在以上研究的基础上,提出一个引入上下文信息的句法歧义消解模型;3.对GLR分析算法进行概率化扩展,形成了本文的句法分析算法。4.用实验证明了本文句法分析方法的有效性。本文的实验采用了1998年1月的人民日报语料库和中科院计算所机器翻译句法树库作为训练语料,根据树库总结出实验所用语法规则,进行了小规模的分组实验。实验证明,本文的句法分析方法具有较高的分析效率和正确率。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 本文的研究目的和意义
  • 1.2 句法分析方法综述
  • 1.2.1 基于规则的方法
  • 1.2.2 基于统计的方法
  • 1.3 汉语句法分析研究现状
  • 1.3.1 汉语句法分析面临的问题
  • 1.3.2 汉语句法分析的发展趋势
  • 1.4 本文的主要研究内容
  • 第二章 统计句法分析模型和句法分析算法研究
  • 2.1 统计句法分析的基本理论
  • 2.1.1 语言模型、句法分析模型和句法分析算法
  • 2.1.2 句法分析模型的评价标准
  • 2.1.3 数据稀疏问题
  • 2.2 常用统计句法分析模型简介及比较
  • 2.2.1 概率上下文无关文法
  • 2.2.2 基于历史的句法分析模型
  • 2.2.3 分层渐近式句法分析模型
  • 2.2.4 头驱动的统计句法分析模型
  • 2.2.5 四种模型的性能综合比较
  • 2.3 常用句法分析算法概述和分类比较
  • 2.3.1 句法分析算法概述
  • 2.3.2 句法分析算法的分类与比较
  • 第三章 本文的句法分析方法
  • 3.1 概率模型
  • 3.2 语法规则概率的获取
  • 3.3 结构共现概率的计算方法
  • 3.4 分析算法
  • 3.4.1 分析表的构造
  • 3.4.2 分析算法描述
  • 3.4.3 用例子描述算法分析过程
  • 第四章 实验与实验结果分析
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 附录
  • 致谢
  • 作者攻读学位期间发表的学术论文目录
  • 相关论文文献

    • [1].基于概率上下文无关文法的口令强度评估方法[J]. 物联网技术 2017(04)
    • [2].量子上下文无关文法的代数性质[J]. 计算机工程与应用 2011(04)
    • [3].模糊上下文无关文法语法分析和识别的并行算法[J]. 商丘师范学院学报 2011(09)
    • [4].模糊上下文无关文法的判定定理[J]. 内江师范学院学报 2008(12)
    • [5].格值上下文无关文法的范式[J]. 纯粹数学与应用数学 2010(02)
    • [6].连接文法在并行环境下的语法分析和识别[J]. 太原师范学院学报(自然科学版) 2008(02)
    • [7].上下文无关文法的可视化描述[J]. 广州大学学报(自然科学版) 2016(01)
    • [8].模糊上下文无关文法的Chomsky范式和Greibach范式[J]. 系统工程理论与实践 2010(03)
    • [9].格值上下文无关文法的代数刻画[J]. 榆林学院学报 2011(04)
    • [10].上下文无关文法与藏语句法分析[J]. 西藏大学学报(自然科学版) 2013(02)
    • [11].浅谈在编译原理教学中知识意义的建构[J]. 教育教学论坛 2014(50)
    • [12].扰动模糊文法及其语言[J]. 内江师范学院学报 2017(10)
    • [13].基于量子逻辑的下推自动机与上下文无关文法[J]. 软件学报 2010(09)
    • [14].基于完备剩余格值逻辑的下推自动机与上下文无关文法[J]. 山东大学学报(理学版) 2019(05)
    • [15].一种基于样本的模拟口令集生成算法[J]. 计算机学报 2017(05)
    • [16].编译原理中文法的教学探讨[J]. 现代计算机(专业版) 2010(13)
    • [17].一个上下文无关文法的构造定理及其在推断中的应用[J]. 计算机与现代化 2008(06)
    • [18].上下文无关文法在孤立词识别中的应用[J]. 太原城市职业技术学院学报 2011(05)
    • [19].基于规则的模糊语句分析[J]. 软件导刊 2009(06)
    • [20].格值下推自动机与格值上下文无关文法[J]. 计算机工程与应用 2011(25)
    • [21].人-机语言理解的歧义性比较研究[J]. 世界科技研究与发展 2008(02)
    • [22].基于自然语言问题的电子病历分析工具—QReport[J]. 山西大学学报(自然科学版) 2018(01)
    • [23].基于变型空间代数的自动程序修复方法[J]. 电子学报 2017(10)
    • [24].基于主题PCFG的口令猜测模型研究[J]. 信息网络安全 2019(08)
    • [25].一种基于结构划分概率的口令攻击方法[J]. 计算机学报 2014(05)
    • [26].基于上下文无关文法的数据抽取规则[J]. 河南城建学院学报 2010(05)
    • [27].对《科学》和《自然》上两个递归实验的质疑:基于对汉语母语者的测试[J]. 外国语(上海外国语大学学报) 2018(05)
    • [28].基于Earley算法的关联文法语法分析的并行处理[J]. 陕西理工学院学报(自然科学版) 2012(03)
    • [29].形式语言中的几个算法问题[J]. 计算机教育 2011(14)
    • [30].采用预测策略的Earley算法[J]. 计算机科学 2010(01)

    标签:;  ;  ;  

    基于概率上下文无关文法的汉语句法分析方法研究
    下载Doc文档

    猜你喜欢