中文机构名称及地址的汉英翻译方法研究

中文机构名称及地址的汉英翻译方法研究

论文摘要

机器翻译(Machine Translation: MT)就是用计算机将一种自然语言翻译为另一种自然语言。经过七十多年的发展,目前机器翻译已经深入到各个子领域的研究。在翻译方法的研究上,基于统计的机器翻译方法逐渐占据了统治地位;而对于翻译对象,领域术语、命名实体(Named Entities: NE)等主要事实信息的翻译,正在成为研究者关注的焦点。在人名、地名的翻译任务利用音译技术基本完成之后,机构名称、地址等非音译信息的翻译成为命名实体翻译探索的重点。由于现有的机构名称及地址的汉英双语语料极其匮乏,导致当前主流的基于统计的机器翻译技术无法发挥优势。针对上述情况,本文提出使用基于规则的中文地址汉英翻译方法和基于多层次匹配的中文机构名称汉英翻译方法来解决中文地址和机构名称的汉英翻译任务,并对翻译知识的自动获取方法进行了深入研究。具体地讲,本文从如下几个方面进行了研究:1.应用当前主流的统计翻译工具pharaoh对机构名称的翻译性能进行分析,进而提出一种基于分字的机构名称统计翻译方法,并将基于分字和分词的翻译短语进行融合。两种方法使得译文的BLEU评分分别提高了8.1%和20%。2.探索了利用汉英双语地址对获取中文地址汉英翻译规则的途径,提出了基于等价翻译短语的中文地址汉英翻译规则获取方案,给出等价翻译短语的自动获取算法和基于转换错误驱动的翻译规则的自动学习算法。3.研究了中文机构名称汉英翻译知识的多层次获取方法。机构名称汉英翻译任务要求翻译出来的译文尽量符合人们以往的翻译习惯,而当前可用的双语资源十分有限。在这种情况下,本文研究了机构名称翻译知识的多层次获取方法,该方法使得有限的翻译知识得到了充分的利用。4.在命名实体汉英双语语料匮乏的情况下,为了解决中文机构名称及地址的汉英翻译任务,本文设计并实现了基于规则的中文地址汉英翻译系统和基于多级匹配的中文机构名称汉英翻译系统。实验表明,在仅有几千条标准汉英双语语料的情况下,两个系统开放测试的BLEU评分分别为0.7167和0.5531,基本达到了实用化的翻译水平。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 本文研究的背景和意义
  • 1.1.1 研究的背景
  • 1.1.2 研究的意义
  • 1.2 命名实体翻译研究的现状和分析
  • 1.2.1 通用机器翻译研究现状
  • 1.2.2 命名实体翻译的相关研究
  • 1.3 本文的主要研究内容和组织
  • 第2章 基于统计的机构名称翻译方法研究
  • 2.1 引言
  • 2.2 基于统计的机器翻译方法的总体框架
  • 2.2.1 基于信源信道模型的统计机器翻译方法
  • 2.2.2 基于平行概率语法的统计机器翻译方法
  • 2.2.3 基于最大熵的统计机器翻译方法
  • 2.3 基于分字和分词混合知识的机构名称翻译方法
  • 2.3.1 基于混合知识的机构名称翻译原理
  • 2.3.2 基于混合知识的命名实体统计翻译对比实验及分析
  • 2.4 中文机构名称统计翻译分析
  • 2.5 本章小结
  • 第3章 中文地址汉英翻译规则的自动获取
  • 3.1 引言
  • 3.2 等价翻译短语的定义及获取
  • 3.2.1 等价翻译短语的定义
  • 3.2.2 等价翻译短语的获取
  • 3.3 翻译等价对的翻译规则表示
  • 3.3.1 翻译规则的描述内容
  • 3.3.2 面向翻译等价对的地址翻译规则
  • 3.4 基于转换错误驱动的翻译规则自动学习
  • 3.4.1 基于规则求精的冲突消解的思想
  • 3.4.2 基于转换错误驱动的翻译规则自动学习方法
  • 3.4.3 实验结果及分析
  • 3.5 本章小结
  • 第4章 中文机构名称汉英翻译知识的自动获取
  • 4.1 引言
  • 4.2 机构性质关键词获取
  • 4.2.1 机构性质关键词抽取的相关说明
  • 4.2.2 机构性质关键词抽取方法
  • 4.3 机构名称双语词典获取
  • 4.3.1 双语对齐概述
  • 4.3.2 利用双语对齐获取机构名称翻译专用词典
  • 4.3.3 机构名称分词
  • 4.4 机构名称经营范围字段固定搭配获取
  • 4.4.1 固定搭配抽取的相关说明
  • 4.4.2 机构名称经营范围字段固定搭配抽取方法
  • 4.5 机构名称翻译模板获取
  • 4.5.1 机构名称翻译模板抽取的意义
  • 4.5.2 机构名称翻译模板抽取方法
  • 4.6 本章小结
  • 第5章 中文机构名称及地址汉英翻译系统设计实现
  • 5.1 引言
  • 5.2 中文机构名称汉英翻译系统
  • 5.2.1 中文机构名称汉英翻译系统设计
  • 5.2.2 实验结果及相关分析
  • 5.3 中文地址汉英翻译系统
  • 5.3.1 中文地址汉英翻译系统设计
  • 5.3.2 实验结果及相关分析
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 附录
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].试论商贸汉英翻译原则:以薄熙来演讲译文片段为例[J]. 外语艺术教育研究 2008(01)
    • [2].由“不折腾”的翻译看汉英翻译中文化信息的处理[J]. 知识经济 2019(36)
    • [3].博物馆展品汉英翻译规范化模式探究[J]. 淮海工学院学报(人文社会科学版) 2019(12)
    • [4].新时代加强发展大学生汉英翻译能力的实践[J]. 现代交际 2020(02)
    • [5].文化特色词中价值观的理想汉英翻译研究[J]. 海外英语 2020(05)
    • [6].论中国日用品名称汉英翻译的不统一问题及对策探讨[J]. 黑龙江教师发展学院学报 2020(04)
    • [7].矫正外科汉英翻译用词特点及高效翻译策略[J]. 英语广场 2020(23)
    • [8].逻辑与文学汉英翻译[J]. 民族翻译 2020(03)
    • [9].互文性理论指导下大学汉英翻译教学研究——评《新编汉英翻译教程》[J]. 高教探索 2019(04)
    • [10].郑州市公示语汉英翻译问题及对策研究[J]. 河南教育(高教) 2017(02)
    • [11].网络热词汉英翻译探析[J]. 华北水利水电大学学报(社会科学版) 2017(02)
    • [12].商务信函汉英翻译要点与实例解析[J]. 广西教育学院学报 2017(02)
    • [13].浅谈旅游文本汉英翻译的技巧——以《十八水原生态景区介绍》的翻译为例[J]. 佳木斯职业学院学报 2017(08)
    • [14].目的论视阈下的公司简介汉英翻译研究[J]. 海外英语 2017(03)
    • [15].信息·表达·呼唤——应用汉英翻译策略浅析[J]. 攀枝花学院学报 2017(04)
    • [16].浅析汉英翻译之中式英语现状及翻译对策[J]. 赤子(上中旬) 2014(24)
    • [17].基于语块理论的汉英翻译教学策略[J]. 淮北师范大学学报(哲学社会科学版) 2014(06)
    • [18].基于语用学的公示语汉英翻译现状分析[J]. 常州大学学报(社会科学版) 2015(02)
    • [19].泰特勒翻译三原则指导下的张培基汉英翻译分析——以《我坐了木船》为例[J]. 北方文学 2020(02)
    • [20].汉英翻译策略研究[J]. 作家天地 2020(12)
    • [21].“女子太阳节”汉英翻译时间报告[J]. 长江丛刊 2019(31)
    • [22].隐喻的认知及其汉英翻译的探索[J]. 读与写(教育教学刊) 2010(07)
    • [23].商贸汉英翻译原则在商贸汉英翻译中的运用[J]. 中国校外教育 2014(S2)
    • [24].旅游外宣视角下的民俗文化词汇汉英翻译研究——以浙江丽水为例[J]. 文教资料 2016(27)
    • [25].旅游景点汉英翻译中的错误类型及其原因探析[J]. 文教资料 2017(02)
    • [26].“文化走出去”背景下的汉英翻译分析研究[J]. 长江丛刊 2018(16)
    • [27].进行汉英翻译训练的方法[J]. 语数外学习(高中版下旬) 2018(06)
    • [28].基于跨文化交际视域下的汉英翻译研究与实践[J]. 青年文学家 2018(29)
    • [29].英语翻译与写作的共同思维模式培养研究[J]. 校园英语 2017(06)
    • [30].功能目的论视域下的商务致辞翻译[J]. 山西青年 2017(05)

    标签:;  ;  ;  ;  

    中文机构名称及地址的汉英翻译方法研究
    下载Doc文档

    猜你喜欢