宋词风格的计算机辅助分析研究

宋词风格的计算机辅助分析研究

论文摘要

宋词作为中国古代文学历史上一颗璀璨的明珠,古往今来,无数的学者和研究人员对其投入了大量的研究精力。而对宋词风格的研究更是这些研究中较为重要的一个方面,然而,目前这方面的研究主要集中在人文学领域。本文主要从计算机的角度出发,利用现代的信息处理技术,对宋词的风格进行辅助性分析。具体来说本文主要讨论以下几个方面的问题:1.对诗词风格的计算机辅助分析进行了总结和分类,介绍了主要的几种使用方法的思想和大体步骤。并在此基础上简单的分析了这几种方法的差异及优劣。2.建立和完善宋词语料库。按照格律、风格、情感分析等的需要将宋词细分为子句,并对子句字串进行统计,利用词频、互信息和共现度等参数来抽取结合强度大的字串。在此基础上对语料库中的宋词作品进行了词语切分,同时对语料库中的部分词语进行了格律和词性标注。3.提出了适合宋词风格表示的宋词文档表示模型。根据宋词风格表现整体性的特点,本文优化了数据挖掘中的发现关联规则的方法,寻找宋词风格分类中所需要的频繁关键词共现集合,借此来更多地保留风格评判中所需要的分类信息。同时结合知网中使用到的义原,将宋词文档中的词语和频繁关键词共现映射到概念级,用部分语义来表示词语集合。随后,提出了基于概念和频繁关键词共现的诗词风格表示模型,并用该模型来表示一篇宋词文档。4.将宋词的风格分类转化成文本分类问题,运用文本分类的算法对宋词的风格进行评判。文中分别比较了不同分类算法的差异,从实际情况出发,选择了一种适合宋词风格分类的分类算法,优化了算法中的各项参数,最后在此基础上实现了宋词风格类型的评判。实验表明,本文建立的诗词风格表示模型可以很好地应用于诗词风格的分类,并有助于不同风格诗歌的计算机生成。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 前言
  • 1.2 研究背景
  • 1.3 相关领域已有的研究
  • 1.4 本课题研究的内容和目标
  • 1.5 本课题研究的主要贡献
  • 1.6 论文结构
  • 第二章 中国古代汉语计算机辅助研究综述
  • 2.1 前言
  • 2.2 诗词计算机辅助研究的相关工作
  • 2.3 课题研究思路
  • 2.4 本章小结
  • 第三章 宋词风格研究语料库的建立
  • 3.1 前言
  • 3.2 宋词的特点和语料库建立技术
  • 3.3 宋词风格研究语料库的主要组成部分
  • 3.4 本章小结
  • 第四章 频繁关键词共现的抽取
  • 4.1 前言
  • 4.2 数据挖掘的基本概念
  • 4.3 关联规则的概念
  • 4.4 关联规则的挖掘过程
  • 4.5 Apriori算法描述
  • 4.5.1 发现频繁项集的主要算法的伪代码
  • 4.5.2 发现频繁项集的子程序的伪代码
  • 4.6 Apriori算法的实验数据
  • 4.7 实验结果分析
  • 4.8 本章小结
  • 第五章 宋词风格分类模型设计
  • 5.1 前言
  • 5.2 宋词的风格
  • 5.3 经典的文本分类算法
  • 5.3.1 朴素贝叶斯方法
  • 5.3.2 K-最近邻算法
  • 5.3.3 支持向量机
  • 5.4 问题转化
  • 5.5 宋词风格的评判流程
  • 5.6 宋词文档预处理
  • 5.7 宋词文档的特征表示模型
  • 5.7.1 常用的特征表示模型
  • 5.7.2 基于概念的关键词选择
  • 5.7.3 频繁关键词共现的提取
  • 5.7.4 基于概念和频繁关键词共现的向量空间模型
  • 5.8 本章小结
  • 第六章 宋词风格分类算法
  • 6.1 宋词风格的计算机分类
  • 6.2 宋词风格分类及实验
  • 6.2.1 实验语料库的选取
  • 6.2.2 文档的特征表示模型
  • 6.2.3 KNN分类算法的实验结果
  • 6.2.4 实验结果的性能评价
  • 6.3 本章小结
  • 第七章 总结与展望
  • 7.1 研究工作的总结
  • 7.2 进一步研究工作的展望
  • 参考文献
  • 致谢语
  • 附录 作者在攻读硕士学位期间发表的文章
  • 相关论文文献

    标签:;  ;  ;  ;  

    宋词风格的计算机辅助分析研究
    下载Doc文档

    猜你喜欢