论文摘要
诗歌是一种具有独特魅力的文学体裁,是人类文明的象征,用计算机模拟生成诗歌史自然语言生成领域的一大挑战。本文研究机器自动生成仿唐诗,对其可能性和具体实现方法进行详细的研究和讨论。研究内容主要有以下几大方面:1、总结和分类诗歌生成领域到目前为止的研究成果,对每种方法的主要步骤和代表性诗歌生成系统进行介绍。并简述中国古典诗词的计算语言学研究概况。2、建立唐诗语料库。将词句按格律细分为子句,统计子句字串,根据频率、共现度等参数抽取结合强度高的字串,结合各种已有的词典资源来建立唐诗词表。根据条件概率对已切分的唐诗进行注音,建立音韵数据库。3、根据唐诗建立相关的语法规范,用确定性自动机(DFA)进行词句语法合法性判断。计算语义度量:通过潜在语义分析和互信息计算词义相关度;通过词典和语料库统计相结合的方法计算词义相似度;成立专家组对高频词进行风格和情感的分级评判。4、基于进化策略建立仿唐诗生成模型。根据唐诗特点,编码方式是基于平仄规律的,适应度函数是基于语法和语义加权值的,选择策略是基于精英主义和轮盘赌算法的。各主要操作的实现步骤在文中都有详细介绍。5、建立基于进化策略的仿唐诗生成系统,包括给出系统框架、主要实现流程和具体的仿唐诗生成实例。并且对实验结果进行了分析和总结。实验结果表明,本文建立的计算模型和设计的系统基本上可以实现计算机自动生成仿唐诗的目标,为今后进一步的研究提供了理论和实验基础。
论文目录
摘要ABSTRACT目录Content第一章 引言1.1 研究的技术背景1.2 研究的内容与目标1.3 本文研究的主要贡献1.4 论文结构第二章 诗词生成及汉语计算诗学综述2.1 计算机诗歌生成综述2.1.1 随机词汇连接(Word Salada)2.1.2 基于模版的诗歌生成系统2.1.3 基于设定模式的诗歌生成系统2.1.4 基于进化算法的诗歌生成系统2.1.5 基于实例推理的诗歌生成系统2.2 汉语古诗词计算机辅助研究综述第三章 唐诗切分语料库及音韵数据库的建立3.1 全唐诗切分语料库的建立3.2 词库的词性标注3.3 词库的音韵标注第四章 语法规范的确立和语义度量的计算4.1 语法规则的判定4.2 词义相关度的计算4.2.1 利用潜在语义分析计算词义相关度4.2.2 利用互信息计算词义相关度4.2.3 计算结果的综合处理4.3 词义相似度的计算4.4 词的风格与情感意义标注第五章 仿唐诗生成的进化策略5.1 进化策略简介及适用性分析5.1.1 基本原理5.1.2 两种进化策略5.1.3 进化策略的基本思想5.1.4 进化策略执行过程5.2 编码方案5.3 初始种群的生成5.4 适应值函数5.5 选择操作5.6 重组算子5.7 变异算子第六章 仿唐诗生成的系统实现与实验结果分析6.1 系统框架6.2 进化策略流程及主要参数确定6.3 系统的实现与运行情况6.3.1 开发和运行平台6.3.2 系统生成实例6.4 系统性能评价及结果分析结论与未来展望参考文献攻读学位期间发表论文致谢
相关论文文献
标签:自然语言生成论文; 计算诗学论文; 仿唐诗生成论文; 进化策略论文;