论文摘要
随着机器翻译技术的不断发展,对完全句法分析质量的要求也越来越高。由于完全句法分析(full parsing)要确定句子所包含的全部句法信息,并确定句子中各成分之间的关系,这是一项十分困难的任务。到目前为之,无论是句法分析器的正确率,还是其运行速度和鲁棒性等各方面,都还难以达到令人满意的程度,这种状况严重地制约了以完全句法分析为基础的自然语言处理相关研究的发展和应用系统的开发。为了降低问题的复杂度,同时获得一定的句法结构信息,短语识别应运而生。本文借鉴了英语chunk的定义、根据汉语自身的语言学特点以及Upenn ChineseTreeBank 5.1标注本身的特点,将汉语短语定义为十种基本短语结构。在该定义的指导下,从Upenn ChineseTreeBank 5.1中抽取语料。论文论述了条件随机场的基本原理,并通过与其他传统的标注模型进行了理论和实验方面的比较,阐述了条件随机场在标注任务中的性能优越性,在此基础上提出了基于条件随机场(CRFs)的汉语短语识别方法,并搭建汉语短语识别实验系统,对测试语料进行短语识别。实验结果表明,相对于Markov和HMMs模型来说,本文提出的短语定义和识别算法具有较高的识别性能;大规模的语料有助于汉语短语识别性能的提高。另外,在Upenn ChineseTreeBank 5.1上,二阶的CRFs识别结果并不比二阶的CRFs好很多,这是由于二阶CRFs在使用更多的上下文特征时,数据稀疏造成的。本文提出的短语识别方法在一定程度上使完全句法分析的任务得到了简化,同时也有利于完全句法分析在大规模真实文本处理系统中迅速得到运用。
论文目录
相关论文文献
- [1].关键短语生成研究现状[J]. 现代计算机 2020(07)
- [2].基于协同训练的电商领域短语挖掘[J]. 计算机工程 2020(04)
- [3].基于短语成分表示的中文关系抽取[J]. 数据采集与处理 2020(03)
- [4].基于风险短语挖掘的知识聚合模型研究[J]. 情报理论与实践 2020(08)
- [5].基于语言和文化视角下的“吃字短语”研究[J]. 山西能源学院学报 2019(01)
- [6].三项以上联合短语的特征分析[J]. 兰州文理学院学报(社会科学版) 2017(01)
- [7].基于多策略过滤的汉日多词短语抽取和对齐[J]. 山东大学学报(理学版) 2015(09)
- [8].短语知识在文言阅读考查中的应用[J]. 新作文(语文教学研究) 2019(05)
- [9].高中英语教学中的短语积累及扩展探析[J]. 读写算 2019(04)
- [10].论比况短语[J]. 语文学刊 2010(15)
- [11].我会用“的”字短语[J]. 快乐作文 2017(45)
- [12].短语连一连(英文)[J]. 阅读 2018(Z5)
- [13].好记实用的押韵短语[J]. 初中生 2018(Z6)
- [14].中考英语高频短语“连连看”[J]. 初中生天地 2017(33)
- [15].短语连一连[J]. 疯狂英语(小学版) 2016(06)
- [16].别样的短语教学 精彩的语用训练[J]. 小学教学设计 2016(22)
- [17].短语连一连[J]. 疯狂英语(小学版) 2016(11)
- [18].短语连一连[J]. 阅读 2016(77)
- [19].主动出击 巧“默”短语[J]. 小学教学设计 2015(06)
- [20].四字短语 “语”重心长[J]. 语文天地 2015(14)
- [21].短语动词考点解读[J]. 初中生之友 2013(29)
- [22].孔庆蕾短语(组诗)[J]. 海燕 2015(06)
- [23].有关“mouth”的趣味短语[J]. 青苹果 2012(04)
- [24].have引导的短语[J]. 小学教学设计 2012(36)
- [25].美国人最爱用的个性短语[J]. 家教世界 2013(01)
- [26].怎样扩词成短语[J]. 作文世界 2013(Z2)
- [27].有这样一种四字短语[J]. 初中生 2013(Z5)
- [28].编辑短语[J]. 民间传奇故事(A卷) 2009(06)
- [29].运用口诀 巧辨易混短语[J]. 中考金刊 2009(01)
- [30].运用口诀巧辨易混短语[J]. 学生之友(初中版)(下) 2010(01)