基于短语的对数线性模型的统计机器翻译方法与系统实现

基于短语的对数线性模型的统计机器翻译方法与系统实现

论文摘要

统计机器翻译是一种完全基于数据驱动的机器翻译方法,相比其它方法能更高效和客观地构建翻译系统,而且随着当前计算机可读语料的飞速膨胀和计算机运算性能的极大提升,统计机器翻译已经成为机器翻译研究领域的热点和前沿。作为统计机器翻译研究的重点,不同的翻译方法一直是决定翻译效果的关键因素。基于此认识,本文进行了基于短语的对数线性模型的统计机器翻译方法的研究并实现了一个基于该方法的翻译系统,在实验和专利翻译的应用中取得到了较好的翻译效果。本文的主要工作是:短语对齐模型和N-gram统计语言模型的研究和分析,其中包括词对齐及其生成短语对齐模型的计算方法、N-gram统计语言模型的计算和回退方法;基于短语的对数线性模型的原理分析,在其基础上提出了一种多模型的特征组合方式,包括正反向对齐模型和多个语言模型的融合,实验结果证明了这种组合的有效性;基于柱搜索算法的翻译流程的研究,包括对短语翻译候选项的生成、未来概率计算、搜索和剪枝以及译文生成等算法的深入分析,并基于该流程设计实现了一个模块化、可移植、可定制且构造代价小的翻译系统,在实验和应用中均取得了不错的效果;另外,针对一般翻译系统采用内存方式组织短语翻译表带来的问题,提出了一种采用文件索引形式的存储策略,能大大降低系统对使用环境的需求,合理分配计算资源。基于短语的对数线性模型的统计机器翻译方法研究及其系统的实现涉及到统计机器翻译的各个环节,本文在模型和算法方面的探索也证明了该方法的有效性。最后,本文阐述了对统计机器翻译发展和趋势的思考,提出了未来统计机器翻译的应用及其与语言学知识的融合的目标。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 机器翻译的发展历程和研究现状
  • 1.3 机器翻译的方法论概述
  • 1.3.1 基于理性主义的方法
  • 1.3.2 基于经验主义的方法
  • 1.4 课题的提出
  • 1.5 论文结构
  • 第2章 统计机器翻译方法
  • 2.1 统计机器翻译概述
  • 2.1.1 统计机器翻译及其发展简述
  • 2.1.2 统计机器翻译的特点
  • 2.1.3 统计机器翻译的过程
  • 2.2 统计机器翻译模型
  • 2.2.1 噪声通道模型
  • 2.2.2 对数线性模型
  • 2.3 小结
  • 第3章 基于短语的对数线性模型
  • 3.1 基于短语的对齐模型
  • 3.1.1 词对齐模型
  • 3.1.2 短语对齐模型
  • 3.2 N-gram 统计语言模型
  • 3.2.1 N-gram 统计语言模型的数学描述
  • 3.2.2 N-gram 统计语言模型的平滑
  • 3.3 基于短语的对数线性模型
  • 3.4 小结
  • 第4章 系统的设计和实现
  • 4.1 翻译流程概述
  • 4.2 翻译候选项的生成(translation options generation)
  • 4.3 未来代价计算(future cost estimates)
  • 4.4 柱搜索(beam search)
  • 4.4.1 核心算法(core algorithm)
  • 4.4.2 合并(recombination)剪枝
  • 4.4.3 柱状图(histogram)剪枝
  • 4.5 译文的生成
  • 4.6 其它数值模型的使用
  • 4.6.1 调序模型(distortion model)
  • 4.6.2 长度惩罚模型(length model)
  • 4.7 基于文件索引存储的对齐模型
  • 4.8 系统的实现
  • 4.8.1 系统特性
  • 4.8.2 特征模型的使用
  • 4.8.3 系统的使用
  • 4.9 小结
  • 第5章 实验结果评价和应用分析
  • 5.1 评价指标
  • 5.2 实验条件
  • 5.2.1 训练数据
  • 5.2.2 实验数据
  • 5.2.3 对比测试系统
  • 5.2.4 系统运行环境
  • 5.3 实验结果
  • 5.3.1 预处理对翻译结果的影响
  • 5.3.2 特征模型及其参数对翻译结果的影响
  • 5.3.3 系统运行参数对翻译结果的影响
  • 5.3.4 文件索引形式的对齐模型对系统的性能影响
  • 5.4 系统在专利翻译中的应用
  • 5.5 小结
  • 结束语
  • 参考文献
  • 致谢
  • 攻读硕士期间发表(含录用)的学术论文
  • 相关论文文献

    • [1].现代藏语信息熵的估算及语言模型的复杂度[J]. 电子技术与软件工程 2020(17)
    • [2].量子语言模型研究综述[J]. 中国科学:信息科学 2018(11)
    • [3].神经语言模型在框架排歧中的应用[J]. 广西民族师范学院学报 2017(03)
    • [4].基于层次语言模型的英语动名词搭配纠错策略[J]. 计算机系统应用 2017(09)
    • [5].基于软聚类的模糊类语言模型[J]. 军事通信技术 2015(01)
    • [6].统计语言模型浅析[J]. 科技风 2015(12)
    • [7].基于位置语言模型的中文信息检索系统的研究[J]. 计算机科学 2015(07)
    • [8].基于深度预训练语言模型的文献学科自动分类研究[J]. 情报学报 2020(10)
    • [9].基于扩展N元文法模型的快速语言模型预测算法[J]. 自动化学报 2012(10)
    • [10].应用于信息检索的统计语言模型研究进展[J]. 情报理论与实践 2008(03)
    • [11].基于神经网络语言模型的作者身份验证[J]. 情报理论与实践 2020(03)
    • [12].基于范畴论的形式语言模型建模方法研究[J]. 计算机应用与软件 2015(04)
    • [13].模糊语言模型在唇读系统中的应用[J]. 信号处理 2015(10)
    • [14].融合双向语言模型的半监督属性识别方法研究[J]. 计算机与数字工程 2020(10)
    • [15].结合语义的位置语言模型[J]. 北京大学学报(自然科学版) 2013(02)
    • [16].基于统计语言模型的英语易读性研究[J]. 解放军外国语学院学报 2010(06)
    • [17].对IRSTLM的分析和改进[J]. 心智与计算 2008(01)
    • [18].文本词向量与预训练语言模型研究[J]. 上海电力大学学报 2020(04)
    • [19].面向语言模型的神经元连接自动学习方法[J]. 厦门大学学报(自然科学版) 2019(02)
    • [20].神经网络语言模型的结构与技术研究评述[J]. 现代计算机 2019(19)
    • [21].三元统计语言模型对基因表达载体设计的优化[J]. 计算机工程与应用 2016(15)
    • [22].基于统计语言模型的信息检索演进探析[J]. 图书情报知识 2010(03)
    • [23].基于文本分类的语义平滑在语言模型中的应用(英文)[J]. 成都信息工程学院学报 2008(03)
    • [24].基于预训练语言模型的中文零指代消解[J]. 信息通信 2020(05)
    • [25].基于改进主题分布特征的神经网络语言模型[J]. 电子与信息学报 2018(01)
    • [26].泛化语言模型在汉维机器翻译中的应用[J]. 计算机应用研究 2014(10)
    • [27].领域语言模型及其在中文输入系统中的应用[J]. 计算机应用与软件 2012(08)
    • [28].触发式语言模型下的混淆网络解码方法[J]. 计算机工程与应用 2011(10)
    • [29].基于聚类语言模型的生物文献检索技术研究[J]. 中文信息学报 2008(01)
    • [30].一个语言模型压缩方法的研究与实践[J]. 苏州大学学报(工科版) 2008(03)

    标签:;  ;  ;  ;  

    基于短语的对数线性模型的统计机器翻译方法与系统实现
    下载Doc文档

    猜你喜欢