Print

基于俄汉双语语料库的同位语的分类与自动提取

论文摘要

本文从自然语言处理的角度,研究俄汉对译句子对语料库中同位语的模式及自动识别和抽取信息等问题。内容包括俄汉语同位语模式化的语言学基础、俄汉对译句子对同位语语义类型及模型、确定同位语结构类型和抽取蕴含信息的算法以及个案举例。在理论研究层面上,揭示了俄汉对译句子对同位语的基本语义类型,并从信息抽取的角度对其进行了分类,较系统地把握了这种结构构成的复杂性和多样性;在操作层面上,本文运用自然语言和图表两种方法分别描写算法,并结合个案举例详细介绍了运用确定性分析法判定俄汉对译句子对中同位结构类型及提取同位结构蕴含信息的过程,为计算机程序员实现自然语言处理提供了较详细的流程图。

论文目录

  • 中文摘要
  • 俄文摘要
  • 绪论
  • 1.本文研究的目的、内容及方法
  • 2.相关术语和概念
  • 3.理论意义与应用价值
  • 第1章 同位现象研究及相关理论
  • 1.1 俄语理论语法对同位语的研究
  • 1.1.1 有关同位语的概念
  • 1.1.2 俄语同位语类型
  • 1.2 汉语对同位现象的研究
  • 1.2.1 有关“同位”的理论研究
  • 1.2.2 同位结构与同位组构
  • 1.2.3 同位组构的类型
  • 1.3 俄语同位语与汉语同位结构的比较与分析
  • 1.3.1 共性
  • 1.3.2 差异
  • 第2章 面向自动识别和信息挖掘的俄汉同位语模式化分析
  • 2.1 带有连字符“-”的同位语类型
  • 2.1.1 普通名词-普通名词
  • 2.1.2 专有名词-普通名词
  • 2.2 带引号“《 》”的同位语类型
  • 2.3 不带连接符号的同位语类型
  • 第3章 同位语的自动识别
  • 3.1 确定性句法分析法
  • 3.1.1 确定性分析系统设计思想的三个特征
  • 3.1.2 确定性分析系统的基本结构
  • 3.2 基于该算法的同位语模式自动提取
  • 3.2.1 与马库斯的确定性句法分析的异同
  • 3.2.2 提取带连字符“-”的同位语及其蕴含信息的算法
  • 3.2.3 提取带引号“《 》”的同位语及其蕴含信息的算法
  • 3.2.4 提取不带连接符号的同位语及其蕴含信息的算法
  • 3.3 算法流程
  • 3.3.1 提取带连字符“-”的同位语及其蕴含信息的算法流程
  • 3.3.2 提取带引号“《 》”的同位语及其蕴含信息的算法流程
  • 3.3.3 提取不带连接符号的同位语及其蕴含信息的算法流程
  • 3.4 个案举例
  • 3.4.1 提取带连字符“-”的同位语及其蕴含信息个案举例
  • 3.4.2 提取带引号“《 》”的同位语及其蕴含信息个案举例
  • 3.4.3 提取不带连接符号的同位语及其蕴含信息个案举例
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/f7b8df6ad23463f7b75d84db.html