基于实例英汉翻译系统研究与实现

基于实例英汉翻译系统研究与实现

论文摘要

机器翻译作为计算机自然语言处理的一个重要分支,经历了漫长而曲折的发展历程。在研究的过程中也诞生了多种机器翻译方法。近年来,随着计算机计算速度,存储容量的不断提高,基于实例的机器翻译(Example-Based Machine Translation,EBMT)方法越来越受到研究者的青睐。基于实例的机器翻译系统,充分利用原有实例的翻译信息,进行匹配替换翻译。因而不需要对源语句和待翻译语句做深层次的语法分析,克服了基于规则的机器翻译系统在知识获取方面的困难。而且,在例句库中拥有和待翻译语句有相似语句时,往往能获得高质量的翻译结果。简单陈述句是英语中其他形式语句的基础,对简单陈述句的研究也是基于实例的机器翻译领域研究的重点。因此本文研究主要针对简单陈述句,并且不考虑时态,语态等信息。本文首先介绍了机器翻译的历史及发展现状。其次重点介绍了基于实例机器翻译(EBMT)的基本原理,系统组成,以及基于实例机器翻译中需要研究的几个相关问题:双语语料库的建立,相似实例的检索,目标语句的重组。本论文研究的主要内容包括四个部分:双语对齐库的建立,双语对齐库的存储与检索,语句相似度的计算,语句片段获取和译句生成。在以上研究的基础上,探索实现了一个简单句英汉机器翻译系统。其基本流程是:对用户或系统输入的英语句子或句子片段,首先提取关键词,通过关键词搜索含有该关键词的例句,从而获得可能的实例翻译对。然后计算待翻译语句与所选实例的语句相似度,使用相似度最高的的实例语句进行比对替换重组,最后输出翻译结果。最后,本文还介绍了翻译系统的实现,实验结果以及评价。从实验结果可以看出,在例句库中有与待译语句相似例句时,往往能获得较好的翻译结果。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 机器翻译的历史
  • 1.1.1 初始阶段:萌芽期(1946年~1966年)
  • 1.1.2 波折阶段:低谷期(1966年~1975年)
  • 1.1.3 恢复阶段:复苏期(1975年~1989年)
  • 1.1.4 新发展阶段:繁荣期(1989年~至今)
  • 1.2 机器翻译的方法
  • 1.2.1 基于规则(Rule-Based)的机器翻译方法
  • 1.2.2 基于统计的机器翻译的方法
  • 1.2.3 基于实例的机器翻译的方法
  • 1.2.4 基于范例推理的机器翻译
  • 1.2.5 多引擎的机器翻译方法
  • 1.3 我国机器翻译状况
  • 1.4 机器翻译的发展前景
  • 1.5 本论文的选题和研究内容
  • 第二章 基于实例的机器翻译
  • 2.1 基本原理
  • 2.2 基于实例的机器翻译系统的组成:
  • 2.3 基于实例的机器翻译的相关问题
  • 2.3.1 双语语料库的建立:
  • 2.3.2 短语片段粒度的划分:
  • 2.3.3 相似实例的检索
  • 2.3.4 目标语句的重组:
  • 2.4 基于实例机器翻译优点
  • 第三章 面向数据的翻译(DOT)模型
  • 3.1 DOP模型
  • 3.2 DOT1模型
  • 3.3 DOT2模型
  • 第四章 语句相似度计算
  • 4.1 语句相似度计算方法概述
  • 4.2 句子编辑距离的概念
  • 4.3 词语语义相似度计算
  • 4.3.1 WordNet简介
  • 4.3.2 基于WordNet的英语词语词义相似度计算
  • 4.4 改进编辑距离计算语句相似度
  • 第五章 EBMT系统的设计
  • 5.1 词性标注和短语结构标注
  • 5.2 建立双语对齐树库
  • 5.2.1 标注源语句对
  • 5.2.2 双语对齐关系标注
  • 5.2.3 双语对齐存储结构
  • 5.2.4 单词索引
  • 5.3 EBMT系统的翻译过程
  • 第六章 EBMT系统的实现
  • 6.1 使用技术介绍
  • 6.1.1 Mysql数据库
  • 6.1.2 Ruby
  • 6.1.3 Rails
  • 6.2 数据库存储设计
  • 6.2.1 语句对存储结构sentences
  • 6.2.2 对应关系存储结构表fragments
  • 6.2.3 索引存储结构表keywords
  • 6.2.4 词语相似度存储表similaritie
  • 6.3 相似度计算模块
  • 6.3.1 词语相似度计算模块
  • 6.3.2 语句相似度计算模块
  • 6.4 XML文档导入
  • 6.5 语料库语句的编辑与添加
  • 6.6 翻译语句重组
  • 6.7 系统实现中遇到的问题
  • 6.7.1 语句相似度计算
  • 6.7.2 多意词意思的选择
  • 6.7.3 中文量词和名词的关联
  • 6.7.4 复数翻译结果的判定
  • 6.7.5 未知单词和句形的翻译
  • 第七章 翻译系统测试结果
  • 第八章 总结和展望
  • 8.1 本系统的优缺点
  • 8.2 EBMT系统的前景展望
  • 致谢
  • 参考文献
  • 攻读硕士期间发表的学术论文
  • 相关论文文献

    • [1].翻译系统论的社会学溯源及其局限性分析[J]. 亚太跨学科翻译研究 2017(01)
    • [2].浅谈受限辅助翻译系统的商品化应用[J]. 合肥工业大学学报(社会科学版) 2008(05)
    • [3].多语种辅助翻译系统研究与实现[J]. 电脑知识与技术 2012(02)
    • [4].移动数据库在嵌入式口语翻译系统中的应用[J]. 电脑开发与应用 2010(12)
    • [5].文学翻译系统分析在教学中的运用[J]. 时代经贸(中旬刊) 2008(S3)
    • [6].翻译系统论的新发展——《卢曼理论在翻译研究中的应用:社会中的翻译》述评[J]. 译苑新谭 2014(00)
    • [7].动态二进制翻译系统的调试器框架[J]. 计算机工程 2009(02)
    • [8].中英文菜单翻译系统的设计与开发[J]. 信息与电脑(理论版) 2011(14)
    • [9].面向瘦客户端的分布式动态二进制翻译系统[J]. 计算机工程 2009(22)
    • [10].试论翻译系统中的“五行”与“八卦”[J]. 中国科教创新导刊 2012(13)
    • [11].计算机语音实时翻译系统原理和实现方法[J]. 考试周刊 2011(83)
    • [12].基于规则的英汉翻译系统的设计与实现[J]. 三明学院学报 2011(06)
    • [13].异构多机器人环境下的二进制翻译系统[J]. 微型电脑应用 2010(02)
    • [14].一个静态二进制翻译系统的设计与实现[J]. 计算机时代 2008(10)
    • [15].基于Android平台的手机翻译系统[J]. 西北成人教育学院学报 2014(05)
    • [16].文学翻译系统规范与译者主体性研究的社会学途径[J]. 中州大学学报 2012(01)
    • [17].《翻译科技新视野》出版[J]. 东方翻译 2015(03)
    • [18].动态翻译系统中的间接转移关联软件预测算法[J]. 计算机研究与发展 2014(03)
    • [19].基于J2EE的高校学生成绩和证书翻译系统的设计与实现[J]. 云南档案 2014(05)
    • [20].从“有机体”角度整体透视翻译系统[J]. 上海翻译 2010(03)
    • [21].对翻译中“约定俗成”的再思考[J]. 上海翻译 2009(02)
    • [22].基于Globish的旅游用英汉翻译系统的研究[J]. 企业科技与发展 2008(12)
    • [23].基于Web的翻译系统评价[J]. 中国科技翻译 2012(01)
    • [24].基于信息技术的科技翻译系统研究[J]. 情报科学 2013(02)
    • [25].BTASUP二进制翻译系统的性能改善策略[J]. 微处理机 2008(01)
    • [26].古文翻译系统的设计与实现[J]. 电脑知识与技术 2009(04)
    • [27].旅游翻译系统研究[J]. 宁波大学学报(人文科学版) 2013(02)
    • [28].面向国际标准的英汉、汉英双向机器辅助翻译系统[J]. 世界标准信息 2008(06)
    • [29].动态二进制翻译器CrossBit的性能分析与评估[J]. 计算机工程与应用 2008(27)
    • [30].基于Hadoop与XMPP的云翻译系统的研究与实现[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  

    基于实例英汉翻译系统研究与实现
    下载Doc文档

    猜你喜欢