面向领域辅助翻译的词典资源获取

面向领域辅助翻译的词典资源获取

论文摘要

随着我国信息化进程的深入和电子政务的建设,大量的社会和经济信息已经电子化。而由于国际政治经济的交流和发展,如何向世界范围内发布这些相关的信息成为一个现实需求。近年来机器翻译技术虽然取得了很大的进展,特别是统计翻译方法的突破,使得自动翻译结果多数情况下可以满足日常浏览的需求,但是在面对高质量跨语言信息发布的需求时,机器辅助翻译仍然是更加现实的解决方案。本文针对电子化信息的翻译问题,以一个发布公司基本信息的电子信息库为例,探索了针对特定领域的机器辅助翻译系统的开发技术。本文分析发现目前中文信息的电子化手段多采用数据库形式,并将不同关键信息分字段存放。信息库中不仅包含大量的机构名称、地址、人名等命名实体信息,还包含大量专业术语等领域文本特征。而针对信息发布的需求,其翻译过程强调信息关键点的准确性,而不十分看重全文翻译质量和速度。针对这些翻译需求,本文重点研究了相关的辅助翻译技术,探索了多层次、多类型的翻译词典获取方法。具体地,本文的研究内容包括:(1)针对翻译领域中的各种单语词汇,研究特定领域中几种主要中文词典的构建方法,包括:利用n-gram字串的频率信息实现单语词典辅助获取系统,提高领域一般词汇的获取速度;以中文机构地址的层次性词典获取为突破口,研究层次性词典获取问题;以中文机构类别的获取为突破口,研究后缀型词汇的获取方法。(2)探索了基于Web的中文机构名称译文获取技术。针对命名实体的专有固定译文获取难题,通过构建包含原文和启发信息的查询,获取并分析搜索引擎返回的结果页,进而通过构词知识和机器学习方法解决正确译文的识别。实验表明,该方法能在较短时间内获取大部分中文机构名称的译文,避免了以往Web平行语料挖掘的对于存储空间和网络带宽的巨大负担。(3)设计并实现了面向领域信息发布的辅助翻译系统。在上述几种词典资源获取方法及基于Web的译文获取技术的基础上,本文设计并实现了针对领域信息发布的机器辅助翻译系统,该系统为用户提供了关键词标注、自动翻译、摘译等功能,辅助用户翻译,初步满足了用户的跨语言信息加工需求。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景及意义
  • 1.2 国内外研究现状
  • 1.3 本文的主要研究内容
  • 第2章 单语词典获取
  • 2.1 依据文本语料的特点进行词典获取
  • 2.2 单语词典辅助获取系统
  • 2.2.1 基本思想及系统流程
  • 2.2.2 主要数据结构
  • 2.2.3 性能评价
  • 2.3 中文地址层次性词典获取
  • 2.3.1 基本思想及系统流程
  • 2.3.2 种子树的构建
  • 2.3.3 自动扩充
  • 2.3.4 手工扩充
  • 2.3.5 性能评价
  • 2.4 中文机构类别后缀性词典获取
  • 2.4.1 基本思想
  • 2.4.2 树的构建
  • 2.4.3 特征空间
  • 2.4.4 实验结果及分析
  • 2.5 本章小结
  • 第3章 基于WEB 的双语词典获取
  • 3.1 中文机构名称及其特点
  • 3.2 基于WEB 的译文辅助获取系统的设计与实现
  • 3.2.1 系统流程
  • 3.2.2 各模块功能介绍及主要实现技术
  • 3.3 对比实验
  • 3.3.1 实验数据
  • 3.3.2 评价标准
  • 3.3.3 Query 构造对比实验
  • 3.3.4 候选译文排序对比实验
  • 3.4 本章小结
  • 第4章 面向领域信息发布的辅助翻译系统
  • 4.1 辅助翻译技术介绍
  • 4.2 系统框架
  • 4.3 系统各功能模块
  • 4.4 系统性能评价
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 附录1 单语词典辅助获取系统用户界面
  • 附录2 中文地址层次性词典辅助获取系统用户界面
  • 附录3 面向领域信息发布的辅助翻译系统用户界面
  • 致谢
  • 相关论文文献

    • [1].中华书局版《北京话词典》读后[J]. 北京史学 2018(01)
    • [2].汉语新词语英译词典稿件中的典型问题分析[J]. 传播力研究 2020(09)
    • [3].《新时代大俄汉词典》的背后——“中国辞典故事”之三[J]. 博览群书 2020(07)
    • [4].牛津词典2017年度热词:“青年震荡”[J]. 世界知识 2018(01)
    • [5].任务投入量假说视角下的英汉少儿图解词典对比分析——以词汇任务为例[J]. 广东外语外贸大学学报 2016(05)
    • [6].汉语搭配词典存在的问题及应对策略研究[J]. 辞书研究 2017(01)
    • [7].文化的传承 语言的记载——评《中华汉英大词典(上)》[J]. 辞书研究 2017(04)
    • [8].论沈苇《新疆词典》的地域性与超地域性[J]. 北京教育学院学报 2017(04)
    • [9].一部内容丰赡、精益求精的词典——评《实用英汉技术词典》[J]. 教育文化论坛 2015(06)
    • [10].词典里的“埋伏”[J]. 现代班组 2016(09)
    • [11].试论网络词典对翻译学习的影响[J]. 山西煤炭管理干部学院学报 2015(01)
    • [12].论现代词典的内在教育价值[J]. 外语研究 2015(04)
    • [13].抗疫词典(组诗)[J]. 诗林 2020(02)
    • [14].小词典[J]. 中国诗歌 2018(06)
    • [15].音乐小词典[J]. 中小学音乐教育 2009(01)
    • [16].《实用汉英中西医词典》编撰体例创新探讨[J]. 疯狂英语(理论版) 2016(03)
    • [17].词典例证翻译标准探索[J]. 疯狂英语(理论版) 2017(01)
    • [18].《哈尔滨方言词典》补正[J]. 现代语文(语言研究版) 2010(09)
    • [19].牛津词典公布2017年度热词:“青年震荡”[J]. 黄金时代(学生族) 2018(01)
    • [20].英国互联网上的“众筹词典”[J]. 高中生 2018(22)
    • [21].词典的故事[J]. 小学生优秀作文 2018(28)
    • [22].嫉妒,还是羡慕[J]. 高中生 2017(27)
    • [23].试析几部与“翻译”相关的词典之属性[J]. 环球人文地理 2014(02)
    • [24].有尊严地做教育[J]. 湖北教育(综合资讯) 2014(09)
    • [25].《明清吴语词典》释义探讨[J]. 中国训诂学报 2013(00)
    • [26].校园魔鬼词典新编[J]. 意林(少年版) 2012(04)
    • [27].词典例证研究述评[J]. 中国科教创新导刊 2012(13)
    • [28].生活词典(外二首)[J]. 青年作家 2013(02)
    • [29].浑河的词典[J]. 诗潮 2013(08)
    • [30].会议词典[J]. 杂文月刊(选刊版) 2009(02)

    标签:;  ;  ;  ;  

    面向领域辅助翻译的词典资源获取
    下载Doc文档

    猜你喜欢