现代汉语高频后缀派生词的识别研究

现代汉语高频后缀派生词的识别研究

论文摘要

在中文信息处理领域,自动分词是一项基础工作,未登录词的切分是影响分词正确率的重要因素之一。派生词占据了未登录词中新词的大部分,解决好派生词的识别问题,对提高分词精度和进一步的汉语句法自动分析都有着重要的意义。本文在考察大规模语料的基础上,以信息处理为目标,选取后缀“子”、“头”和“者”作为研究对象。首先探讨其派生词的内部构词规律和左右边界特征,然后结合搭配信息和共现频率等进行识别算法设计。本文共分为六章:绪论,介绍选题意义,界定研究对象,对研究现状进行评述,提出本文的研究方法。然后介绍语料的来源及其处理方法。第一章,介绍分词和分词歧义的相关概念,对词法分析的总体模式和规则的形式化表述进行说明。第二章,主要从派生词的内部结构探讨后缀“子”构词的音节限制条件和词类限制条件,以及含后缀“子”派生词的左右边界特征。第三章,主要从派生词的内部结构探讨后缀“头”构词的音节限制条件和词类限制条件,以及含后缀“头”派生词的左右边界特征。第四章,主要从派生词的内部结构探讨后缀“者”构词的音节限制条件和词类限制条件,以及“者”的相关因素分析。第五章,在总结前几章研究结果的基础上,建立词语表和规则库,提出识别的总体思路和方法,并介绍识别的步骤,进行算法设计,对疑难问题进行分析。第六章,首先总结本文研究的结论,进而提出存在的不足和尚需解决的问题,并对未来研究作可能的展望。

论文目录

  • 摘要
  • Abstract
  • 零 绪论
  • 0.1 选题意义
  • 0.2 国内外研究状况
  • 0.2.1 汉语词缀研究
  • 0.2.2 自动识别研究
  • 0.3 本文采用的理论、方法和语料
  • 0.3.1 本文采用的主要理论和方法
  • 0.3.2 本文所采用的语料
  • 0.4 可能的创新点
  • 0.5 存在的困难和解决这些困难的打算
  • 0.6 主要内容(思路、章节内容简介)
  • 第一章 总体设计
  • 1.1 分词的相关概念
  • 1.2 歧义的类型及处理方法
  • 1.2.1 歧义的类型
  • 1.2.2 歧义的处理方法
  • 1.3 规则的形式化表述
  • 1.3.1 变量表示法
  • 1.3.2 条件表达式
  • 1.3.3 复杂特征表示法
  • 第二章 后缀“子”及相关因素分析
  • 2.1 后缀“子”构词的音节限制条件
  • 2.1.1 含后缀“子”的双音节词
  • 2.1.2 含后缀“子”的三音节和多音节词
  • 2.1.3 小结
  • 2.2 后缀“子”构词的词类限制条件
  • 2.2.1 名词性的“X”
  • 2.2.2 形容词性的“X”
  • 2.2.3 动词性的“X”
  • 2.2.4 量词性的“X”
  • 2.2.5 小结
  • 2.3 含后缀“子”派生词的边界特征
  • 2.3.1 含后缀“子”派生词的左边界特征
  • 2.3.2 “子”的右边成分分析
  • 2.4 小结
  • 第三章 后缀“头”及相关因素分析
  • 3.1 后缀“头”构词的音节限制条件
  • 3.1.1 含后缀“头”的双音节词
  • 3.1.2 含后缀“头”的三音节词
  • 3.2 后缀“头”构词的词类限制条件
  • 3.2.1 名词性词根+头
  • 3.2.2 动词性词根+头
  • 3.2.3 形容词性词根+头
  • 3.2.4 方位词词根+头
  • 3.3 “头”缀派生词的边界特征
  • 3.4 小结
  • 第四章 后缀“者”及相关因素分析
  • 4.1 后缀“者”构词的音节限制条件
  • 4.1.1 含后缀“者”的双音节词
  • 4.1.2 含后缀“者”的三音节和多音节词
  • 4.2 “X + 者”中“X”的语法性质
  • 4.2.1 名词性的“X”
  • 4.2.2 动词性的“X”
  • 4.2.3 形容词性的“X”
  • 4.3 “者”的相关因素分析
  • 第五章 后缀派生词自动识别的算法设计
  • 5.1 识别的总体思路
  • 5.1.1 词语表的建立
  • 5.1.2 规则库的建立
  • 5.1.3 对歧义的处理
  • 5.2 派生词识别的算法设计和识别步骤
  • 5.2.1 算法设计和识别步骤
  • 5.2.2 后缀派生词自动识别的流程图
  • 5.3 疑难问题分析
  • 第六章 结语
  • 6.1 本文的结论
  • 6.2 尚需解决的问题和对未来研究的展望
  • 参考文献
  • 附录
  • 致谢
  • 攻读学位期间发表的学术论文
  • 相关论文文献

    • [1].课堂上的那些“疑问句”[J]. 青年教师 2011(01)
    • [2].论近代翻译对现代汉语身份的塑造[J]. 江苏科技大学学报(社会科学版) 2020(01)
    • [3].浅析现代汉语语素特征的表现及应用[J]. 汉字文化 2020(07)
    • [4].网络文化背景下现代汉语言的变异分析[J]. 文化创新比较研究 2020(15)
    • [5].试析现代汉语语气形式成分[J]. 语言科学 2020(04)
    • [6].现代汉语历时演变视角下“到底”的使用与发展[J]. 宁夏大学学报(人文社会科学版) 2020(04)
    • [7].21世纪现代汉语数量短语国内研究综述[J]. 文化学刊 2020(10)
    • [8].第十二届海峡两岸现代汉语问题学术研讨会征稿[J]. 语言科学 2019(05)
    • [9].现代汉语时间名词研究述评[J]. 无锡职业技术学院学报 2016(06)
    • [10].情景语境对现代汉语文章写作的影响[J]. 写作(上旬刊) 2016(12)
    • [11].浅谈现代汉语构式“毫无疑问”的成因及其变体[J]. 佳木斯职业学院学报 2016(12)
    • [12].现代汉语“N中的N”结构探讨[J]. 滁州学院学报 2016(06)
    • [13].现代汉语中的离合词探究[J]. 科技经济导刊 2017(10)
    • [14].现代汉语双及物结构式研究——一本专注于现代汉语双及物结构式研究的专著[J]. 汉语学报 2017(02)
    • [15].现代汉语指人名词语言歧视的标记性探析[J]. 吉林师范大学学报(人文社会科学版) 2017(04)
    • [16].注重历练思维方法,编写“现代汉语”教材[J]. 语文知识 2017(20)
    • [17].普及 探索 创新——力量教授《现代汉语百题辨异》评述[J]. 淮阴师范学院学报(哲学社会科学版) 2015(06)
    • [18].现代汉语中的夫妻称谓语和称呼语[J]. 语文教学通讯·D刊(学术刊) 2016(02)
    • [19].现代汉语数范畴研究[J]. 语言文字应用 2016(03)
    • [20].现代汉语“好不”研究[J]. 科技展望 2014(23)
    • [21].“现代汉语规范字(辞)典”系列[J]. 编辑学刊 2015(01)
    • [22].现代汉语感叹句研究现状及展望[J]. 中州大学学报 2015(02)
    • [23].高校“现代汉语”课程改革的思考[J]. 教育理论与实践 2015(21)
    • [24].一部赢得港澳台及大陆地区普遍重视的现代汉语教材[J]. 励耘语言学刊 2019(02)
    • [25].现代汉语复合趋向补语的认知原理浅析[J]. 发明与创新(职业教育) 2020(01)
    • [26].“楞”“愣”关系及“楞”在现代汉语中的地位[J]. 汉字汉语研究 2020(03)
    • [27].网络文化背景下现代汉语的规范化分析[J]. 参花(下) 2020(11)
    • [28].现代汉语范围副词“光”句中位置变动探究[J]. 北方文学 2019(33)
    • [29].阳光教育让每个生命尽享阳光[J]. 北京教育(普教版) 2016(12)
    • [30].浅说现代汉语中的介词“自”[J]. 文教资料 2016(25)

    标签:;  ;  ;  

    现代汉语高频后缀派生词的识别研究
    下载Doc文档

    猜你喜欢