论文摘要
泛化的EBMT(Example-based machine translation)是针对传统EBMT的一种改进方案,它利用翻译模板取代翻译实例,这样既减小了实例库的规模,同时也在一定程度上提高了模板匹配的几率,是一种有效的机器翻译方法。本文在泛化的EBMT的基础上,采用基于短语模板的方法,展开进一步的研究工作:在泛化EBMT中引入句法分析技术,将句子抽取成短语模板和主干模板,构建双层翻译模板库,同时提出一种句子相似度模型的训练方法。其主要过程如下:在模板的抽取阶段,利用句法分析器对双语平行语料中的源语言句子进行句法分析,将分析结果中的短语部分抽取出来,留下句子的主干部分;然后根据词语对齐关系把目标语言的句子也分为对应的主干和短语部分,从而得到短语平行语料库和主干平行语料库;最后利用语义词典对两个平行语料库分别进行概念的抽取,得到短语模板和主干模板,进而构建翻译模板库。在翻译测试阶段,利用句子相似度算法在模板库中搜索与输入句匹配的模板,然后采用主干模板和短语模板结合的方式进行翻译:利用主干模板翻译输入句的主干部分,利用短语模板翻译输入句中复杂的名词短语,最后得到译文。翻译中使用的语句相似度算法是基于字符序列的相似度算法,选取词语相似度和句子长度差作为特征函数,并利用NIST工具对其进行训练,得到优化的参数组合。实验选取一组双语平行语料构建翻译模板库,并分别作了闭式和开式的翻译测试。实验结果表明,与泛化的EBMT方法相比,基于短语模板的EBMT方法可以减少模板库的规模,提高模板的翻译能力:其开式测试正确率为77.0%,高于泛化的EBMT的正确率51.5%。本文的研究可以应用于实际的机器翻译系统中。
论文目录
相关论文文献
- [1].搭拼式模板的研发与应用[J]. 水利水电施工 2019(03)
- [2].塑面模板在工程中的应用研究[J]. 科技创新与应用 2020(02)
- [3].试论模板早拆技术在建筑施工中的应用[J]. 中国标准化 2019(24)
- [4].模板早拆体系在建筑工程中的应用[J]. 城市建筑 2019(32)
- [5].透水模板布在高架桥桥墩施工中的应用[J]. 黑龙江交通科技 2020(03)
- [6].一种新型预制T梁模板吊装装置的设计及应用价值分析[J]. 公路 2020(06)
- [7].思考建筑工程铝模板施工关键技术[J]. 绿色环保建材 2020(07)
- [8].思考建筑工程铝模板施工关键技术[J]. 四川水泥 2020(09)
- [9].论定型化模板钢支撑体系优势[J]. 砖瓦 2020(09)
- [10].答题模板:是耶?非耶?[J]. 中学政治教学参考 2014(34)
- [11].建筑工程新型铝模板的运用[J]. 山西建筑 2016(32)
- [12].新型建筑铝模板工艺技术的应用分析[J]. 建材与装饰 2016(44)
- [13].浅谈塑料模板的发展及应用[J]. 四川水泥 2016(11)
- [14].塑料模板在建筑工程中的应用进展[J]. 塑料科技 2016(12)
- [15].简述工程中透水模板布使用前后力学性能的变化[J]. 门窗 2016(11)
- [16].房建施工中现浇梁板模板的要求及质量控制[J]. 建材与装饰 2017(10)
- [17].施工阶段模板早拆技术应用与细节处理探究[J]. 黑龙江科技信息 2017(15)
- [18].浅谈塑料复合模板在北京地区使用利与弊[J]. 城市建设理论研究(电子版) 2017(10)
- [19].铝模板在工程中的应用[J]. 建材技术与应用 2016(02)
- [20].基于法律保护的电视综艺节目模板构建分析[J]. 传播与版权 2016(08)
- [21].问道铝模板[J]. 铝加工 2014(06)
- [22].翻转模板在老挝南欧江项目中的应用[J]. 水利水电施工 2015(01)
- [23].企业模板建站与定制建站有何区别[J]. 计算机与网络 2015(20)
- [24].媒体车展装腔模板[J]. 经营者(汽车商业评论) 2018(11)
- [25].Office时尚应用——带装订线的试卷模板[J]. 电脑爱好者(普及版) 2008(02)
- [26].善用模板,快人一步[J]. 电脑爱好者 2009(05)
- [27].自己动手造模板 漂漂亮亮织“围脖”[J]. 电脑爱好者(普及版) 2010(12)
- [28].投稿模板的制定与应用现状分析[J]. 学报编辑论丛 2013(00)
- [29].神奇的照片[J]. 新作文(小学4-5-6年级版) 2010(12)
- [30].塑料模板在道路工程中的应用[J]. 中国建材科技 2020(05)
标签:基于实例的机器翻译论文; 自然语言处理论文; 短语模板论文; 句法分析论文; 相似度计算论文;