外国留学生汉语习得作文语料库偏误分类及标注设计

外国留学生汉语习得作文语料库偏误分类及标注设计

论文摘要

本文以外国留学生汉语习得作文为研究对象,在现有偏误分类研究的基础上设计并提出面向偏误标注语料库的偏误分类原则、分类标准以及检索偏误时所使用的标注语言,并通过三次试验证明使用本分类标准进行的偏误归类已经具有较高的一致性及可操作性。现有偏误分类研究中面向偏误标注语料库的分类研究尚不成熟,因此,偏误分类标准存在着较大差异。本文提出了对外国留学生汉语习得作文语料库进行偏误分类的实用性、全面性和层级性原则,并在三条原则的指导下确定了4个偏误大类,45个偏误小类,偏误小类分布在标点、字、词项、句子、语义和语用等6个层面中。此外,为偏误小类制定了标注集,标注语言采用偏误名称的拼音首字母缩写的方式。通过三个验证分类一致性的实验,最终证明本分类方法使存在于整篇文章中的偏误和偏误句子的归类都达到了较高的一致性。本文使用了以层级性为主导的偏误分类方法,避免了现代汉语语法研究中所使用的句子成分名称作为偏误类别的名称,而代之以词项偏误、句子格式偏误、语义偏误以及语用偏误等偏误名称。在偏误分类研究方法中提出了一种新的分析角度。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 问题的提出
  • 1.1 研究动机
  • 1.2 研究目标
  • 1.3 研究内容
  • 1.4 研究方法
  • 1.5 研究意义
  • 1.6 论文结构
  • 第二章 外国留学生汉语习得中偏误的分类研究综述
  • 2.1 偏误的界定
  • 2.2 偏误研究的发展过程
  • 2.3 各专项偏误分析研究综述
  • 2.3.1 针对个别词的偏误研究
  • 2.3.2 针对某一类词的研究
  • 2.3.3 针对句法成分的研究
  • 2.3.4 针对句型的研究
  • 2.3.5 针对篇章的研究
  • 2.4 汉语语法偏误研究中偏误分类的研究成果
  • 2.4.1 将遗漏、误加、误代、错序和杂糅作为分类标准
  • 2.4.2 从汉语语言单位角度进行分类
  • 2.5 现有偏误标注语料库中对偏误的分类
  • 2.6 本章小结
  • 第三章 外国留学生汉语习得作文语料库偏误分类的原则及标准
  • 3.1 偏误分类原则
  • 3.1.1 实用性原则
  • 3.1.2 全面性原则
  • 3.1.3 层级性原则
  • 3.2 偏误分类的前提条件
  • 3.2.1 偏误的确定
  • 3.2.2 偏误的层次划分
  • 3.3 偏误的分类标准
  • 3.3.1 偏误大类的确定
  • 3.3.2 不同层面语言单位的偏误分类
  • 3.4 本章小结
  • 第四章 基于以汉语作为第二语言的语料库中偏误的标注及说明
  • 4.1 语料情况
  • 4.2 语料标注标记集
  • 4.2.1 标注语言的选取
  • 4.2.2 标注集
  • 4.3 标注及标注中的具体处理
  • 4.4 本章小结
  • 第五章 实验验证分类结果及测试结果讨论
  • 5.1 实验目的
  • 5.2 测试对象
  • 5.3 测试工具
  • 5.4 校标的选取
  • 5.5 测试过程
  • 5.6 试验结果及统计分析
  • 5.6.1 实验结果
  • 5.6.2 描述性统计
  • 5.7 本章小结
  • 第六章 结论
  • 6.1 主要研究成果
  • 6.2 研究意义
  • 6.3 对未来研究的建议
  • 参考文献
  • 附录
  • 附录1 实证研究偏误语料(一)
  • 附录2 实证研究偏误语料(二)
  • 附录3 实证研究偏误语料(三)
  • 附录4 偏误语料(一)(原文扫描)
  • 附录5 偏误语料(二)(原文扫描)
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 上海交通大学学位论文答辩决议书
  • 相关论文文献

    • [1].基于动态误分类代价下的代价敏感属性选择[J]. 数码设计 2016(03)
    • [2].基于支持向量机的误分类代价敏感模糊推理系统[J]. 控制与决策 2010(02)
    • [3].嵌入误分类代价和拒识代价的二元分类算法[J]. 广西师范大学学报(自然科学版) 2010(03)
    • [4].基于条件误分类的决策树剪枝算法[J]. 计算机工程 2010(23)
    • [5].口误概念与汉语口误分类[J]. 现代语文(语言研究版) 2011(12)
    • [6].动态误分类代价下代价敏感属性选择分治算法[J]. 计算机工程与应用 2018(03)
    • [7].主动学习中一种基于委员会的误分类采样算法[J]. 计算机工程与科学 2008(04)
    • [8].嵌入误分类代价和拒识代价的极限学习机基因表达数据分类[J]. 山东大学学报(工学版) 2013(04)
    • [9].基于XGBoost的三分类优惠券预测方法[J]. 南京航空航天大学学报 2019(05)
    • [10].代价敏感属性中动态误分类代价下的Fisher判别函数[J]. 湖北农机化 2019(24)
    • [11].代价敏感属性中动态误分类代价下Bayes判别函数探究[J]. 湖北农机化 2019(22)
    • [12].基于信息加工的管制人误分类分析模型研究[J]. 西安航空学院学报 2015(04)
    • [13].基于流形学习的代价敏感特征选择[J]. 山东大学学报(理学版) 2017(03)
    • [14].休闲方式你选对了吗?——基于主观幸福感的研究[J]. 上海财经大学学报 2017(06)
    • [15].基于遗传神经网络的误分类代价敏感网络入侵检测[J]. 计算机系统应用 2011(06)
    • [16].国内外民航机务维修人误分类分析系统研究进展[J]. 中国民航飞行学院学报 2008(06)
    • [17].误分类模式在券商客户管理中的应用[J]. 人民论坛 2010(32)
    • [18].民航人因失误分类框架[J]. 中国安全生产科学技术 2009(06)
    • [19].基于ECOC的多类代价敏感分类方法[J]. 计算机科学 2020(S1)
    • [20].一种代价敏感随机森林算法[J]. 武汉大学学报(工学版) 2014(05)
    • [21].基于机器学习的不同属性数据的分类选择[J]. 新经济 2015(17)
    • [22].人因失误分类理论及其在医疗领域中的应用[J]. 中国医疗设备 2012(10)
    • [23].代价敏感最优误差边界选择[J]. 计算机科学与探索 2013(12)
    • [24].基于代价敏感极端学习机的电力系统暂态稳定评估方法[J]. 电力自动化设备 2016(02)
    • [25].基于粒度变换的多范畴复杂信息分类方法[J]. 计算机与现代化 2014(03)
    • [26].基于性价比的分裂属性选择方法[J]. 计算机应用 2009(03)
    • [27].分类数据的计量误差模型[J]. 统计与信息论坛 2010(11)
    • [28].慢性粒单核细胞白血病诊治进展[J]. 临床血液学杂志 2019(02)
    • [29].误差在Cost-Sensitive分类中的应用[J]. 广西师范大学学报(自然科学版) 2011(02)
    • [30].基于隐Markov树故障诊断的确定退火设计[J]. 系统工程与电子技术 2008(07)

    标签:;  ;  ;  ;  ;  

    外国留学生汉语习得作文语料库偏误分类及标注设计
    下载Doc文档

    猜你喜欢