基于实例的机器翻译关键技术的研究和实现

基于实例的机器翻译关键技术的研究和实现

论文摘要

本文首先分析了机器翻译的几个核心部分,总结了机器翻译的系统框架,讨论了机器翻译建模时应该考虑的因素,详细的分析了句子分割、句子对齐、翻译知识获取、翻译片断选择和译文生成在机器翻译过程中的作用,完成了一种基于实例的机器翻译的建模,实现了一个基于实例的机器翻译系统。本文所做的工作主要包括:1.全面研究并分析了影响机器翻译的几个核心部分,总结了机器翻译的系统框架,深入探讨了机器翻译建模时的考虑因素;2.研究了常见的几种句子对齐模型,提出了一种综合的句子对齐模型。实验表明,和以往的句子对齐方法相比,该模型显著地提高了句子对齐的正确率;3.提出了基本对译片断对的方法,利用词汇对齐结果实现了从双语语料库中自动获取基于基本对译片断库。该方法由于不使用句法分析知识,可以在任何双语语料库上抽取对译片断,具有语言独立性。本文完成了基于实例的机器翻译模型的建模,并实现了该模型。实验数据表明,本文提出的基于实例的机器翻译系统能较好的完成机器翻译,并具有翻译知识自动获取,语言独立等特点。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 机器翻译发展和研究现状
  • 1.2.1 机器翻译的发展
  • 1.2.2 机器翻译的应用
  • 1.2.3 机器翻译的技术发展
  • 1.3 研究内容和意义
  • 1.4 本文的组织
  • 第2章 机器翻译及主要技术研究
  • 2.1 机器翻译
  • 2.1.1 机器翻译的形式化描述
  • 2.1.2 机器翻译的系统框架
  • 2.2 机器翻译模型
  • 2.2.1 基于规则的机器翻译模型
  • 2.2.2 基于统计的机器翻译模型
  • 2.2.3 基于实例的机器翻译模型
  • 2.3 翻译系统主要技术简介
  • 2.3.1 中文分词
  • 2.3.2 句子对齐
  • 2.3.3 翻译知识获取
  • 2.4 翻译质量评价
  • 2.4.1 正确率(Precision Rate)
  • 2.4.2 召回率(Recall Rate)
  • 2.4.3 Dice 系数正确率(Dice Coefficient)
  • 2.5 本章小结
  • 第3章 一个基于实例的机器翻译系统的设计和实现
  • 3.1 基于实例的机器翻译总体流程
  • 3.2 句子分割
  • 3.3 句子对齐
  • 3.4 翻译知识获取
  • 3.5 译文片断选择
  • 3.5.1 利用统计翻译模型评价译文
  • 3.5.2 利用片断中的对齐词汇个数评价译文质量
  • 3.5.3 译文片断之间的耦合函数
  • 3.6 译文生成
  • 3.7 主要代码接口说明
  • 3.8 本章小结
  • 第4章 实验及相关问题分析
  • 4.1 句子对齐实验结果及分析
  • 4.1.1 利用长度方法对齐
  • 4.1.2 利用综合方法对齐
  • 4.1.3 利用长度方法和综合方法对齐的比较
  • 4.1.4 不同对齐方法的实验结果举例
  • 4.2 翻译知识自动抽取实验结果及分析
  • 4.3 翻译知识评测
  • 4.4 开放测试实验结果及分析
  • 4.4.1 人工评测结果
  • 4.4.2 自动评测结果
  • 4.4.3 实验结果分析
  • 4.5 本章小结
  • 第5章 总结与展望
  • 参考文献
  • 攻读学位期间公开发表的论文
  • 附录1 部分中译英测试语句
  • 附录2 部分英译中测试语句
  • 致谢
  • 详细摘要
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于实例的机器翻译关键技术的研究和实现
    下载Doc文档

    猜你喜欢