基于实例的汉维—维汉双向机器翻译系统的研究

基于实例的汉维—维汉双向机器翻译系统的研究

论文摘要

机器翻译(Machine Translation)是指用计算机自动地将一种人类语言转换成另一种人类语言,例如将维吾尔语译成汉语或者将汉语译成维吾尔语。在不同策略的翻译方法中,基于实例的机器翻译方法避免了复杂的深层次的语法和语义分析,具有译文精确、翻译速度快、获取翻译知识简单的优点。本文首先回顾了机器翻译发展史、简单地介绍了各种机器翻译方法和机器翻译现状。描述了基于实例的机器翻译方法的原理、系统结构、相关问题以及该方法的优点。在着重描述黏着型语言信息处理以及机器翻译研究现状,较为深入分析了双语实例库的建立、维吾尔语句子相似度计算方法以及相似句子组合方法,并提出了基于实例的汉维-维汉双向翻译系统设计方案并加以实现。主要在以下方面做了一些探索性的工作,研究了汉语维吾尔语双语翻译实例库的构建方法;汉语维吾尔语双语实例库索引的建立方法;维吾尔语句子相似度计算方法;汉语维吾尔语双语翻译实例片段的匹配组合方法。在此基础上设计与实现了基于实例的汉维-维汉双向机器翻译系统。小规模实验结果表明本系统对相似句子翻译的质量高,而对于实例库差距较大的句子翻译质量较低,系统还有完善的空间。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 本课题来源
  • 1.2 研究背景
  • 1.3 研究意义
  • 1.4 本文研究内容
  • 1.5 本文贡献
  • 1.6 文章结构
  • 第二章 相关研究工作
  • 2.1 机器翻译发展史
  • 2.2 按机器翻译的转换层次分类
  • 2.2.1 直接型的机器翻译
  • 2.2.2 转换型的机器翻译
  • 2.2.3 中间语言型的机器翻译
  • 2.3 按实现方法分类
  • 2.3.1 基于规则的机器翻译方法
  • 2.3.2 基于实例的机器翻译方法
  • 2.3.3 基于统计的机器翻译方法
  • 2.4 黏着语信息处理以及机器翻译研究现状
  • 2.5 维吾尔语信息处理以及机器翻译研究现状
  • 2.6 本章小结
  • 第三章 基于实例的机器翻译
  • 3.1 基本原理
  • 3.2 基于实例的机器翻译系统结构
  • 3.3 基于实例的机器翻译的相关问题
  • 3.3.1 双语实例库的建立
  • 3.3.3 相似实例的检索
  • 3.3.4 实例片段的组合
  • 3.4 基于实例的机器翻译方法的优点
  • 3.5 本章小结
  • 第四章 双语实例库的构建
  • 4.1 实例库构建前期工作
  • 4.1.1 维吾尔语的校对
  • 4.1.2 维吾尔语的句子边界识别
  • 4.1.3 词干提取
  • 4.1.4 对偶词识别
  • 4.1.5 汉语维吾尔语语料的句子对齐和词对齐
  • 4.2 双语实例库存储格式
  • 4.2.1 双语句对的存储
  • 4.2.2 词对齐信息的存储
  • 4.3 倒排索引的建立
  • 4.3.1 面临的困难和解决的问题
  • 4.3.2 维吾尔语倒排索引生成工具的功能特征
  • 4.3.3 维吾尔语倒排索引生成
  • 4.3.4 倒排索引存储格式
  • 4.4 本章小结
  • 第五章 句子相似度计算
  • 5.1 维吾尔语句子相似度计算
  • 5.2 维吾尔语句子相似度计算总体描述
  • 5.3 维吾尔语句子相似度计算的具体方法
  • 5.3.1 词形相似度的计算
  • 5.3.2 词序相似度的计算
  • 5.3.3 句长相似度的计算
  • 5.3.4 相似单元夹角的计算
  • 5.3.5 基于词的句子相似度的计算
  • 5.3.6 简单的句子结构相似度计算
  • 5.3.7 最终句子相似度计算
  • 5.4 汉语句子相似度计算
  • 5.5 实验
  • 5.5.1 实验过程
  • 5.5.2 实验结果
  • 5.6 本章小结
  • 第六章 基于实例的汉维-维汉双向机器翻译系统实现
  • 6.1 系统框架
  • 6.2 系统逻辑关系
  • 6.3 系统模块组合方式
  • 6.4 系统数据访问流程
  • 6.5 相似句子组合
  • 6.6 实验与分析
  • 6.7 本章小结
  • 第七章 系统演示
  • 第八章 总结和展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表或录用的学术论文
  • 相关论文文献

    • [1].浅析英汉机器翻译系统的问题和对策[J]. 连云港师范高等专科学校学报 2014(04)
    • [2].谷歌和百度机器翻译系统对军事英语文本中词汇翻译之对比研究[J]. 教育信息化论坛 2019(08)
    • [3].ЭТАП-3机器翻译系统研究[J]. 哈尔滨师范大学社会科学学报 2013(05)
    • [4].多种数据泛化策略融合的神经机器翻译系统[J]. 江西师范大学学报(自然科学版) 2020(01)
    • [5].多策略融合的机器翻译系统研究[J]. 校园英语 2018(15)
    • [6].机器翻译系统的历史与研究现状分析[J]. 淮海工学院学报(人文社会科学版) 2012(12)
    • [7].机器翻译系统发展与研究[J]. 中国新技术新产品 2011(13)
    • [8].基于语料库的机器翻译系统[J]. 术语标准化与信息技术 2010(01)
    • [9].两种类型英汉机器翻译系统性能的对比研究[J]. 企业家天地(理论版) 2010(04)
    • [10].论机器翻译系统的评价体系[J]. 北京理工大学学报(社会科学版) 2008(02)
    • [11].浅析并置理论视角下的机器翻译[J]. 科教文汇(上旬刊) 2014(02)
    • [12].21世纪中俄机器翻译现状对比研究[J]. 哈尔滨师范大学社会科学学报 2012(02)
    • [13].面向翻译教学的机器翻译系统建构[J]. 西安文理学院学报(社会科学版) 2010(03)
    • [14].语义块主辅变换在机器翻译系统中的应用[J]. 洛阳师范学院学报 2010(05)
    • [15].机器翻译系统的模糊评价方法[J]. 微计算机信息 2008(01)
    • [16].基于释义信息的维汉机器翻译系统融合研究探索[J]. 记者观察 2019(29)
    • [17].基于实例的机器翻译系统的模型设计[J]. 西南民族大学学报(自然科学版) 2009(04)
    • [18].英汉机器翻译系统中的词性标注研究[J]. 计算机工程与应用 2010(20)
    • [19].语义块主辅变换在机器翻译系统中的应用[J]. 云南师范大学学报(对外汉语教学与研究版) 2010(04)
    • [20].从机器翻译评测看机器翻译发展[J]. 中国科技翻译 2008(02)
    • [21].基于释义信息的维汉机器翻译系统融合研究[J]. 计算机工程 2019(04)
    • [22].神经机器翻译系统在维吾尔语-汉语翻译中的性能对比[J]. 清华大学学报(自然科学版) 2017(08)
    • [23].多策略汉日机器翻译系统中的核心技术研究[J]. 中文信息学报 2008(05)
    • [24].在线英汉机器翻译系统调查与分析[J]. 语文学刊 2009(19)
    • [25].机器翻译简介[J]. 校园英语 2014(21)
    • [26].汉壮机器翻译初探[J]. 民族翻译 2011(01)
    • [27].汉蒙机器翻译系统中量词翻译研究[J]. 中文信息学报 2010(05)
    • [28].基于统计的汉英机器翻译技术的研究[J]. 电子设计工程 2016(21)
    • [29].人工智能机器翻译能力等级评估标准化研究[J]. 信息技术与标准化 2020(Z1)
    • [30].汉英机器翻译中从句复杂度的错误分析[J]. 微型电脑应用 2020(09)

    标签:;  ;  ;  ;  

    基于实例的汉维—维汉双向机器翻译系统的研究
    下载Doc文档

    猜你喜欢