Print

基于翻译记忆的Web辅助翻译系统研究与设计

论文摘要

翻译记忆技术是目前计算机辅助翻译领域使用最为广泛的核心技术,它充分利用数据库的强大功能来提高已有翻译资料的可复用性,在资料重复度很高的专业翻译领域极大地减少译者的重复劳动,避免相同句子出现多种翻译结果。这篇论文研究和设计的基于翻译记忆的Web辅助翻译系统是在翻译记忆技术研究的基础之上结合互联网应用特性,大量使用Ajax等Web2.0技术,符合软件即服务思想的计算机辅助翻译系统完整的解决方案。由于这一完整的解决方案本身是一套十分复杂的系统工程,在设计过程中遇到诸多问题,论文首先选取记忆数据筛选(模糊查询或语句相似度评价)方法、翻译记忆库和术语库数据模型构建以及段落与片段划分方法三个核心问题进行深入探讨,并给出相应的解决方案;然后对系统整体设计做出说明,以及对其中的核心应用、服务和用户接口三个重要组件做出较为详细的设计描述;最后以翻译一篇英文文章为例对系统的使用做出介绍,并对使用优势加以总结。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 计算机辅助翻译简介
  • 1.1.1 计算机辅助翻译简介及国内外发展现状
  • 1.1.2 翻译记忆技术简介
  • 1.2 本文研究的目的与意义
  • 1.3 本文研究的主要内容
  • 1.4 本文的组织结构
  • 2 翻译记忆数据筛选方法的研究
  • 2.1 文本相似度基本评价方法
  • 2.1.1 计算编辑距离的方法
  • 2.1.2 计算向量余弦和广义Jaccard 系数的方法
  • 2.2 语义相似度基本评价方法
  • 2.2.1 基于本体的方法
  • 2.2.2 基于统计的方法
  • 2.2.3 语法驱动的方法
  • 2.3 改进的方法
  • 2.3.1 改进的编辑距离方法
  • 2.3.2 改进的向量空间模型方法
  • 2.3.3 改进的骨架依存树方法
  • 2.3.4 语法分块的方法
  • 2.3.5 多目标筛选的方法
  • 3 翻译记忆库与术语库数据模型
  • 3.1 翻译记忆库数据模型
  • 3.1.1 翻译记忆交换(TMX)
  • 3.1.2 数据模型设计
  • 3.2 术语库数据模型
  • 3.2.1 术语库交换(TBX)
  • 3.2.2 数据模型设计
  • 4 段落与片段划分方法的研究
  • 4.1 段落划分
  • 4.2 片段划分
  • 5 系统建模
  • 5.1 用例概要建模
  • 5.2 项目管理用例建模
  • 5.3 辅助翻译用例建模
  • 5.4 组件与部署
  • 5.5 组件建模
  • 5.5.1 核心应用(Core)组件建模
  • 5.5.2 服务(Service)组件建模
  • 5.5.3 用户接口(User Interface)组件建模
  • 6 辅助翻译应用举例
  • 6.1 应用举例
  • 6.2 效用说明
  • 7 结论与展望
  • 参考文献
  • 致谢
  • 附录A
  • 附录B
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/30c91b9ec3c02f2d9b9d3d61.html