机器翻译评价的统计方法研究

机器翻译评价的统计方法研究

论文摘要

机器翻译质量的评价研究是近年自然语言处理研究的热点之一,对翻译系统的开发有重要的方向指导意义。设计和执行可靠的翻译评价工作与开发翻译系统一样,非常耗时、耗力,而且复杂性也很高。因此,一些研究者开始对翻译质量的评价方法进行深入的研究。本文的研究内容包括三个主要方面:一是以提高机器翻译评价方法的性能为目标,根据问题的特殊性提出了基于语言模型的翻译评价方法,并通过分数归一化,将自动评分和人工评分进行比较,获得二者的相关系数达到0.79;二是以BLEU方法为基础,研究了基于实例的翻译评价方法在英汉翻译译文质量评价中的应用,探讨了汉语字模型和词模型在研究汉语时特殊语言问题的影响,并将自动评价和人工评价的结果进行了对比,验证了自动评价方法的有效性;三是以现有的机器翻译评价方法为基础,研究了这些评价方法在英汉机器翻译质量评价中应用的可行性,并把各种评价方法所获得的系统分数规则化,在此基础上对多种评价方法获得的结果进行了比较,从而进一步验证了自动化机器翻译评价方法的实用性,为今后更为深入的研究打下基础。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及现状
  • 1.2 机器翻译评价的发展
  • 1.3 语言模型研究的目的和意义
  • 1.4 本文研究的主要内容
  • 第二章 翻译评价方法的性能分析体系
  • 2.1 引言
  • 2.2 翻译评价方法的性能分析体系
  • 2.2.1 信度
  • 2.2.2 效度
  • 2.2.3 区分度
  • 2.2.4 难度
  • 2.2.5 测试集合和效度的关系
  • 2.3 相关系数
  • 2.3.1 相关的含义
  • 2.3.2 相关的种类
  • 2.3.3 相关系数
  • 2.4 本章小结
  • 第三章 基于语言模型的翻译评价方法
  • 3.1 引言
  • 3.1.1 基于语料库统计的语言建模方法概况
  • 3.1.2 基于语言单位的上下文统计语言模型
  • 3.2 基于 N-gram 语言模型的翻译评价方法
  • 3.3 基于语言模型的机器翻译质量评价实验
  • 3.3.1 利用语言模型对翻译结果进行评分
  • 3.3.2 人工评价与基于语言模型的翻译评价结果的比较
  • 3.3.3 自动评价结果和人工评价结果的相关性分析
  • 3.3.4 结果分析
  • 3.4 本章小结
  • 第四章 基于实例的BLEU 翻译评价方法
  • 4.1 引言
  • 4.2 BLEU 方法介绍与实例
  • 4.3 基于实例的BLEU 翻译评价实验
  • 4.3.1 利用BLEU 方法对翻译结果进行评价
  • 4.3.2 人工评价
  • 4.3.3 结果分析
  • 4.4 本章小结
  • 第五章 多种翻译评价方法的比较分析
  • 5.1 引言
  • 5.2 忠实度和可懂度的人工评价
  • 5.3 错误类型分析和加权评分
  • 5.4 孤立点测试方法
  • 5.5 BLEU/NIST 方法
  • 5.6 多种翻译评价方法的比较
  • 5.7 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 附录1 错误类型及样例
  • 致谢
  • 详细摘要
  • 相关论文文献

    • [1].基于语言模型的机器翻译评价方法及其性能评价方法研究[J]. 中国科技信息 2008(20)
    • [2].基于实例的BLEU翻译评价方法[J]. 电脑知识与技术 2009(32)
    • [3].近五十年来自动评分研究综述——兼论中国学生英译汉机器评分系统的新探索[J]. 现代教育技术 2013(06)
    • [4].以机器翻译技术为核心的多语信息处理研究[J]. 中文信息学报 2011(06)
    • [5].我国在线机器翻译财经新闻英中翻译的译文质量对比测评[J]. 海外英语 2020(10)

    标签:;  ;  ;  

    机器翻译评价的统计方法研究
    下载Doc文档

    猜你喜欢