论文摘要
电词的研究是一门新兴的、跨领域的学科。语言学、词学的发展为其打下了坚实的理论础,计算科学、计算语言学、计算词学、语料库语言学及语料库的发展为其实现己的目标供了强有力的技支持和资源保障。本研究课拟就我国少数民族语言(主要以藏语为例)和汉语、英语互译的电词进行研究、设计和构建。多语言电词研究对民族语语音学研究、计算语言学研究、词学研究、器翻译、语言文字教学和民族文字信息处理领域的许多方面,具有重要的学价值和广泛的应用价值,其研究内容和方法涉及民族文字(藏文)分词技、计算语言学、计算词学、语料库语言学、民文信息词研究、统计语言学、数据库技、音频压缩解码技、人交互技、程序设计技等多个学科。多语言电词为民族语语音教学和学习研究供本依据。本文主要从多语言电词的总体方案设计入手,解决民族文字在电词中的实现,以及多语言词库的设计和多语言电词软件的实现。本课还重解决了民族文字鼠标取词以及民族文字和中英文在词软件上的混排问,其中,鼠标取词模块是多语言电词软件功能上的重和技上的难。最后阐了本课在多语言电词研究领域的不足和下一步的研究工作。
论文目录
中文摘要ABSTRACT第一章 绪论1.1 课题概述1.1.1 课题资助1.1.2 课题提出背景及研究价值1.1.3 课题研究成果和完成情况1.2 电子词典相关理论及研究现状1.2.1 计算词典学概述1.2.2 电子词典与相关学科1.2.3 电子词典国内外研究现状和趋势1.3 课题应用前景1.4 本课题的工作1.5 本文的内容结构第二章 多语言电子词典的总体设计2.1 多语言电子词典软件的概念2.2 多语言电子词典设计面临的问题和解决方案2.2.1 民族文字的解决2.2.2 民族文字(藏文)排序检索问题2.3 多语言电子词典的技术路线2.4 多语言电子词典的总体设计流程2.5 多语言电子词典的开发环境第三章 多语言电子词典库的设计3.1 文本词典库的建立3.2 文本库的收词原则3.3 词典来源3.4 藏语词库的前期处理3.5 词典库的格式设计3.5.1 词典文件的组成3.5.2 词典库的整理3.5.3 语音库的建立3.6 藏语词汇分类与翻译3.6.1 词汇分类3.6.2 新词汇产生的社会背景3.6.3 藏文新词汇与藏文翻译第四章 多语言电子词典软件的实现4.1 藏文排序算法的设计4.2 词典查询模块研究4.2.1 单词查询功能4.2.2 检索库的建立4.2.3 查询原理4.2.4 折半查找4.3 多语言电子词典取词技术的实现4.3.1 鼠标屏幕取词实现原理4.3.2 鼠标屏幕取词的关键技术4.3.3 基于PE 文件截获目标函数4.3.4 鼠标屏幕取词的实现过程4.4 藏文编码自动检测及编码转换技术实现4.5 词典压缩技术4.6 其他辅助功能第五章 目前存在的主要问题和展望5.1 民族语词典资源建设与词性标注5.2 藏语分词5.3 藏语语料库分析5.4 下一步工作5.4.1 藏汉英互译词典库进一步完善5.4.2 电子词典功能的进一步完善5.4.3 词典产品的多元化5.4.4 实现藏语的机器翻译系统第六章 多语言电子词典研究成果6.1 桌面版多语言电子词典6.2 网络在线藏汉英词典参考文献主要参考电子词典致谢攻读学位期间的成果及发表论文
相关论文文献
标签:多语言论文; 电子词典论文; 藏汉英论文; 鼠标取词论文;