论文摘要
句法分析是自然语言处理领域一项重要的基础性研究工作。它能够发现自然语言中内在的语法结构,是进行高层信息处理和自然语言理解的基石。其中,基于上下文无关文法(PCFG)的句法分析方法一直是该领域研究的主流。本文在PCFG模型的基础上,提出了一种引入中文语义和句型信息的方法,解决了PCFG模型缺少语义信息及文法之缺少全局约束的问题,改进了中文句法分析器的性能。首先,在句法分析中融入语义信息。尝试在非词汇化句法分析方法中融入语义信息,利用语义信息帮助句法分析进行消歧。加入语义信息后,句法分析器的性能在宾大中文树库(CTB)标划分准集上F值提高了1.37%达到了81.63%1。该方法除了能解决中文里常见的一些歧义外,还能从句法分析的结果中获得带有句法约束的语义信息。其次,在句法分析中融入句型信息。根据句法树和文法之间共现的关系,对句型信息进行建模。利用这种句型信息对句法分析的结果进行约束,纠正了基线系统在清华树库上一些句型标记的错误,F值提高了0.17%达到了86.57%1。
论文目录
摘要ABSTRACT第一章 序言1.1 研究的问题1.2 问题难点1.3 研究历史与现状1.4 研究意义及应用前景1.5 本文的研究思路和主要工作1.6 各章节安排第二章 统计句法分析系统概述2.1 文法的建模2.1.1 乔姆斯基层级体系2.1.2 人类语言的特点2.1.3 概率上下文无关文法2.2 文法概率的获得(训练)2.2.1 有监督的训练方法2.2.2 无监督的训练方法2.3 句法分析(解码)2.4 句法分析评价标准2.5 PCFG 基本模型的改进2.5.1 引入词汇化信息的 PCFG2.5.2 非词汇化 PCFG 模型第三章 融合语义信息的中文句法分析3.1 语义3.2 句法和语义的关系3.3 中文语义信息对句法分析的影响3.4 先前的工作3.5 本文的思路3.6 实现方法3.7 实验3.7.1 语料3.7.2 基线系统及评测标准3.7.3 实验结果及分析3.8 小结第四章 融合句型信息的中文句法分析4.1 句型4.2 概率潜语义分析模型4.2.1 潜语义分析方法4.2.2 PLSA 模型介绍4.2.3 PLSA 模型训练4.3 句型信息建模4.4 句型信息的融合4.5 实验及分析4.5.1 语料4.5.2 基线系统4.5.3 融入句型信息的句法分析实验4.6 小结第五章 工作总结和展望5.1 工作总结5.2 未来工作展望参考文献致谢
相关论文文献
标签:句法分析论文; 概率上下文无关文法论文; 语义论文; 句型论文; 概率潜语义分析论文;