机器翻译评价的统计方法研究

论文摘要

机器翻译质量的评价研究是近年自然语言处理研究的热点之一,对翻译系统的开发有重要的方向指导意义。设计和执行可靠的翻译评价工作与开发翻译系统一样,非常耗时、耗力,而且复杂性也很高。因此,一些研究者开始对翻译质量的评价方法进行深入的研究。本文的研究内容包括三个主要方面:一是以提高机器翻译评价方法的性能为目标,根据问题的特殊性提出了基于语言模型的翻译评价方法,并通过分数归一化,将自动评分和人工评分进行比较,获得二者的相关系数达到0.79;二是以BLEU方法为基础,研究了基于实例的翻译评价方法在英汉翻译译文质量评价中的应用,探讨了汉语字模型和词模型在研究汉语时特殊语言问题的影响,并将自动评价和人工评价的结果进行了对比,验证了自动评价方法的有效性;三是以现有的机器翻译评价方法为基础,研究了这些评价方法在英汉机器翻译质量评价中应用的可行性,并把各种评价方法所获得的系统分数规则化,在此基础上对多种评价方法获得的结果进行了比较,从而进一步验证了自动化机器翻译评价方法的实用性,为今后更为深入的研究打下基础。

论文目录

中文摘要

ABSTRACT

第一章绪论

1.1 研究背景及现状

1.2 机器翻译评价的发展

1.3 语言模型研究的目的和意义

1.4 本文研究的主要内容

第二章翻译评价方法的性能分析体系

2.1 引言

2.2 翻译评价方法的性能分析体系

2.2.1 信度

2.2.2 效度

2.2.3 区分度

2.2.4 难度

2.2.5 测试集合和效度的关系

2.3 相关系数

2.3.1 相关的含义

2.3.2 相关的种类

2.3.3 相关系数

2.4 本章小结

第三章基于语言模型的翻译评价方法

3.1 引言

3.1.1 基于语料库统计的语言建模方法概况

3.1.2 基于语言单位的上下文统计语言模型

3.2 基于 N-gram 语言模型的翻译评价方法

3.3 基于语言模型的机器翻译质量评价实验

3.3.1 利用语言模型对翻译结果进行评分

3.3.2 人工评价与基于语言模型的翻译评价结果的比较

3.3.3 自动评价结果和人工评价结果的相关性分析

3.3.4 结果分析

3.4 本章小结

第四章基于实例的BLEU 翻译评价方法

4.1 引言

4.2 BLEU 方法介绍与实例

4.3 基于实例的BLEU 翻译评价实验

4.3.1 利用BLEU 方法对翻译结果进行评价

4.3.2 人工评价

4.3.3 结果分析

4.4 本章小结

第五章多种翻译评价方法的比较分析

5.1 引言

5.2 忠实度和可懂度的人工评价

5.3 错误类型分析和加权评分

5.4 孤立点测试方法

5.5 BLEU/NIST 方法

5.6 多种翻译评价方法的比较

5.7 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

附录1 错误类型及样例

致谢

详细摘要

机器翻译评价的统计方法研究

论文摘要

论文目录

相关论文文献

猜你喜欢