多语言电子词典构建

多语言电子词典构建

论文摘要

电词的研究是一门新兴的、跨领域的学科。语言学、词学的发展为其打下了坚实的理论础,计算科学、计算语言学、计算词学、语料库语言学及语料库的发展为其实现己的目标供了强有力的技支持和资源保障。本研究课拟就我国少数民族语言(主要以藏语为例)和汉语、英语互译的电词进行研究、设计和构建。多语言电词研究对民族语语音学研究、计算语言学研究、词学研究、器翻译、语言文字教学和民族文字信息处理领域的许多方面,具有重要的学价值和广泛的应用价值,其研究内容和方法涉及民族文字(藏文)分词技、计算语言学、计算词学、语料库语言学、民文信息词研究、统计语言学、数据库技、音频压缩解码技、人交互技、程序设计技等多个学科。多语言电词为民族语语音教学和学习研究供本依据。本文主要从多语言电词的总体方案设计入手,解决民族文字在电词中的实现,以及多语言词库的设计和多语言电词软件的实现。本课还重解决了民族文字鼠标取词以及民族文字和中英文在词软件上的混排问,其中,鼠标取词模块是多语言电词软件功能上的重和技上的难。最后阐了本课在多语言电词研究领域的不足和下一步的研究工作。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题概述
  • 1.1.1 课题资助
  • 1.1.2 课题提出背景及研究价值
  • 1.1.3 课题研究成果和完成情况
  • 1.2 电子词典相关理论及研究现状
  • 1.2.1 计算词典学概述
  • 1.2.2 电子词典与相关学科
  • 1.2.3 电子词典国内外研究现状和趋势
  • 1.3 课题应用前景
  • 1.4 本课题的工作
  • 1.5 本文的内容结构
  • 第二章 多语言电子词典的总体设计
  • 2.1 多语言电子词典软件的概念
  • 2.2 多语言电子词典设计面临的问题和解决方案
  • 2.2.1 民族文字的解决
  • 2.2.2 民族文字(藏文)排序检索问题
  • 2.3 多语言电子词典的技术路线
  • 2.4 多语言电子词典的总体设计流程
  • 2.5 多语言电子词典的开发环境
  • 第三章 多语言电子词典库的设计
  • 3.1 文本词典库的建立
  • 3.2 文本库的收词原则
  • 3.3 词典来源
  • 3.4 藏语词库的前期处理
  • 3.5 词典库的格式设计
  • 3.5.1 词典文件的组成
  • 3.5.2 词典库的整理
  • 3.5.3 语音库的建立
  • 3.6 藏语词汇分类与翻译
  • 3.6.1 词汇分类
  • 3.6.2 新词汇产生的社会背景
  • 3.6.3 藏文新词汇与藏文翻译
  • 第四章 多语言电子词典软件的实现
  • 4.1 藏文排序算法的设计
  • 4.2 词典查询模块研究
  • 4.2.1 单词查询功能
  • 4.2.2 检索库的建立
  • 4.2.3 查询原理
  • 4.2.4 折半查找
  • 4.3 多语言电子词典取词技术的实现
  • 4.3.1 鼠标屏幕取词实现原理
  • 4.3.2 鼠标屏幕取词的关键技术
  • 4.3.3 基于PE 文件截获目标函数
  • 4.3.4 鼠标屏幕取词的实现过程
  • 4.4 藏文编码自动检测及编码转换技术实现
  • 4.5 词典压缩技术
  • 4.6 其他辅助功能
  • 第五章 目前存在的主要问题和展望
  • 5.1 民族语词典资源建设与词性标注
  • 5.2 藏语分词
  • 5.3 藏语语料库分析
  • 5.4 下一步工作
  • 5.4.1 藏汉英互译词典库进一步完善
  • 5.4.2 电子词典功能的进一步完善
  • 5.4.3 词典产品的多元化
  • 5.4.4 实现藏语的机器翻译系统
  • 第六章 多语言电子词典研究成果
  • 6.1 桌面版多语言电子词典
  • 6.2 网络在线藏汉英词典
  • 参考文献
  • 主要参考电子词典
  • 致谢
  • 攻读学位期间的成果及发表论文
  • 相关论文文献

    标签:;  ;  ;  ;  

    多语言电子词典构建
    下载Doc文档

    猜你喜欢