基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究

基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究

论文摘要

本文以对外汉语报刊新闻教学改革为动因,以中国主流报纸动态流通语料库为研究基础,进行了报刊新闻资源库的初步建设,基本形成一个报刊新闻分类资源库。该资源库对报刊新闻文本按领域分类,利用计算机语言信息处理技术对文本进行分词处理和统计,得出各类领域词表。从各类领域词表中用领域相交的方法提取各领域间的通用词语;再利用通用词表用词汇分离的方法提取各领域一级主题词群、各领域中的二级子领域主题词群、子领域中更下位的三级主题词群。主题词群的提取研究是在几个不同的层级上进行的。提取的主题词群带有很强的主题特征。在单文本的主题词群提取实验中,这些主题特征词语对判断文章的主题相关度有较好的效果。本文还对主题词群和报刊新闻主题教学的关系进行了探讨,对主题词群提取的准确度进行了测试,也初步探索了报刊新闻文本的主题相关度和难易度的测量方法。主题词群的研究为报刊新闻教学提供了一个科学、实用的研究平台,同时也为词汇研究探索了一条新的研究思路和方法。 研究路线: 报刊新闻资源库——通用词语——主题词群提取及相关研究——主题教学 围绕主题词群提取这个中心,本文取得了以下的研究成果: 1、构建了一个基于主流报纸动态流通语料库的汉语报刊新闻资源库。 该报刊新闻资源库目前的语料有1.7亿字,33545个文本。利用计算机技术对大规模的真实语料进行了处理,初步建立了对外汉语报刊新闻教学资源库,使报刊新闻素材能够及时得到动态更新。也为报刊新闻教学研究提供了一个科学、实用的研究平台,填补了对外汉语教学研究领域的一项空白。 2、基于报刊新闻资源库初步建立了一个报刊新闻教学分类体系 参考了各种权威的分类法,考察了网页文本分类,对现有的几种对外汉语报刊新闻教材的主题分类作了考察,最后综合各种相关因素提出了报刊新闻资源库的分类框架。在报刊新闻资源库内初步建立了一个有19个领域、91个子领域、189个下位主题的报刊新闻教学领域分类体系,基本涵盖了报刊新闻的主要领域,为报刊新闻和其他课程的教学提供支持。 3、基于十九个领域的分类词表提取了报刊新闻通用词表 本研究的重点是主题词群的提取研究,提取报刊新闻通用词表的目的是为了用词汇分离的方法有效地提取主题词群。因此本通用词表是为词语的领域分类服务的。我们在报刊新闻资源库内提取了在十九个领域间都通用的词语,由于通用词表是在大规模中国主流报纸语料库的基础上产生的,具有领域通用和动态更新的特点,对主题词群的提取具有良好的效果。 4、运用词汇分离的方法提取了不同层级的主题词群 用词汇分离的方法将领域词表、子领域词表中的通用词语和专用词语进行

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 本文动因
  • 1.2 研究背景
  • 1.2.1 对外汉语报刊新闻课的教学需求
  • 1.2.2 关于报刊新闻主题教学的探索
  • 1.2.3 语言信息处理的相关技术
  • 1.2.4 相关术语
  • 1.3 研究基础
  • 1.4 研究目标
  • 1.5 研究内容
  • 1.6 研究方法
  • 1.7 本文的创新点和难点
  • 1.8 本课题研究的意义
  • 第二章 国内外研究现状综述
  • 2.1 关于语料库建设
  • 2.1.1 静态语料库和动态语料库
  • 2.1.2 主流报纸动态流通语料库
  • 2.1.3 主流报纸动态流通语料库的现有成果
  • 2.2 现代汉语词汇的发展变化
  • 2.3 词语的频度、散布度、流通度
  • 2.4 有关词和语的研究
  • 2.4.1 关于词
  • 2.4.2 关于语
  • 2.4.3 提取报纸语料中“语”的必要性
  • 2.5 关于词语的分类
  • 2.5.1 功能分类
  • 2.5.2 主题分类
  • 2.5.3 关于词表和主题词表
  • 2.6 本章小结
  • 第三章 对外汉语报刊新闻教学与报刊新闻资源库的建设
  • 3.1 报刊新闻教学现状和问题
  • 3.1.1 对外汉语报刊新闻教学现状及问题分析
  • 3.1.2 关于报刊新闻教学词表
  • 3.2 报刊新闻主题分类研究
  • 3.2.1 关于主题词表和分类
  • 3.2.2 报刊新闻的主题分类
  • 3.3 对外汉语报刊新闻教学资源库的建设
  • 3.3.1 研究平台——动态流通语料库
  • 3.3.2 核心类和动态类
  • 3.3.3 资源库的基本构成
  • 3.4 本章小结
  • 第四章 报刊新闻领域间通用词表的提取
  • 4.1 报刊新闻各分类领域词表的建立
  • 4.1.1 报刊新闻语料库的领域分类
  • 4.1.2 各类领域大词表的提取过程
  • 4.2 各领域之间通用词表的提取过程
  • 4.2.1 求各领域词表之间的交集
  • 4.2.2 平衡语料之间的交集实验
  • 4.2.3 有关通用词语提取的其他实验
  • 4.3 领域间语义距离的测量实验
  • 4.4 通用词语覆盖情况初步考察
  • 4.5 对通用词语表的初步考察
  • 4.6 本章小结
  • 第五章 报刊新闻各级主题词群的提取
  • 5.1 领域词表的提取
  • 5.1.1 词汇分离
  • 5.1.2 领域词表的提取
  • 5.2 子领域内共用词表和专用词表的提取
  • 5.2.1 以资源、灾难、文化三个领域的子领域为例
  • 5.2.1.1 资源子领域
  • 5.2.1.2 灾难子领域
  • 5.2.1.3 文化子领域
  • 5.2.2 关于子领域共用词语
  • 5.3 更下位的主题词群提取实验
  • 5.3.1 实验一“安乐死”、“禽流感”、“艾滋病”的主题词群提取
  • 5.3.2 实验二中国政府白皮书主题词群的提取
  • 5.4 本章小结
  • 第六章 主题词群研究和报刊新闻主题教学
  • 6.1 多文本聚类的下位主题词群提取
  • 6.2 单一文本的主题词群提取
  • 6.3 文本主题相关度的初步测量
  • 6.4 主题词群提取的方法
  • 6.5 主题词群与报刊新闻主题教学
  • 6.5.1 主题词群与文本个性主题
  • 6.5.2 报刊新闻主题教学
  • 6.6 提取出来的各项词表的应用
  • 6.6.1 词表应用方案
  • 6.6.2 主题词群有助于报刊新闻教学文本选择的实验
  • 6.7 本章小结
  • 第七章 有关通用词语和主题词群的测试报告
  • 7.1 各类词表测试报告
  • 7.1.1 关于通用词语的提取测试
  • 7.1.2 领域词表测试报告
  • 7.1.3 子领域下位主题词群测试报告
  • 7.2 主题词群提取准确度测试
  • 7.2.1 人工选择主题词群和计算机提取主题词群对比试验
  • 7.2.2 关于主题词群提取范围
  • 7.3 利用相关词表进行文本难易度初步分析
  • 7.3.1 利用通用词表对比几种教材词表的难度
  • 7.3.2 文本难易度初步分析
  • 7.4 主题词群在对外汉语教学中所起的作用
  • 7.4.1 有助于文本选择和分类
  • 7.4.2 有助于教材编写的层级性、连贯性和系统性
  • 7.4.3 有助于文章理解、成段叙述和表达,提高教学效果
  • 7.5 本章小结
  • 第八章:存在的问题和后续研究工作
  • 8.1 本研究存在的问题
  • 8.2 后续研究工作
  • 参考文献
  • 附录
  • 科研成果
  • 致谢
  • 相关论文文献

    • [1].俄语次要红色词群的构词扩展分类[J]. 科教文汇(中旬刊) 2015(12)
    • [2].《朱子语类》“体”类词群的文化阐释[J]. 成都大学学报(社会科学版) 2015(03)
    • [3].高中古诗词群文阅读的策略与实践——以咏柳诗的教学为例[J]. 中学语文 2019(30)
    • [4].军语同义词群建构及其在词典编纂中的应用[J]. 现代语文(语言研究版) 2015(02)
    • [5].汉泰词群及其对比研究综述[J]. 现代语文 2019(01)
    • [6].地域文化在基本词上的投影——以“歪”“低”词群为例[J]. 文教资料 2016(27)
    • [7].微信煮词[J]. 音乐天地(音乐创作版) 2017(06)
    • [8].连缀,古诗词群文阅读教学的密钥[J]. 教学月刊小学版(语文) 2016(12)
    • [9].微信煮词[J]. 音乐天地(音乐创作版) 2017(03)
    • [10].微信煮词[J]. 音乐天地(音乐创作版) 2017(04)
    • [11].微信煮词[J]. 音乐天地(音乐创作版) 2017(01)
    • [12].微信煮词[J]. 音乐天地(音乐创作版) 2017(02)
    • [13].微信煮词 第九辑[J]. 音乐天地(音乐创作版) 2017(05)
    • [14].教材编组,推开古诗词群文阅读之门——浅谈小学古诗词教材内容的编组整合[J]. 新课程导学 2017(26)
    • [15].微信煮词(第十一辑)[J]. 音乐天地(音乐创作版) 2017(07)
    • [16].微信煮词[J]. 音乐天地(音乐创作版) 2017(08)
    • [17].共素“安”组同义词群释义研究[J]. 焦作大学学报 2015(04)
    • [18].报纸新闻标题中的“热词群”和“热词串”研究[J]. 洛阳理工学院学报(社会科学版) 2016(04)
    • [19].新词群与同素族异同之比较[J]. 语文学刊 2010(24)
    • [20].汉语“马”词群产生的认知基础[J]. 作家 2012(12)
    • [21].汉语“马”词群的语义转移及其内部语义关系[J]. 赤峰学院学报(汉文哲学社会科学版) 2014(08)
    • [22].从语义视角谈“裸X”族词群的翻译[J]. 吉林省教育学院学报(上旬) 2013(04)
    • [23].浅谈“的士”及其同义词群的竞争与选择[J]. 前沿 2012(02)
    • [24].商业促销活动中“满X”词群使用探微[J]. 东南传播 2012(07)
    • [25].文化视野下的“竹”词群解读[J]. 喀什大学学报 2019(02)
    • [26].利用助学系统实施课外古诗词群文诵读的“四步赏读法”[J]. 作家天地 2020(04)
    • [27].语文核心素养视域下高中诗词群文阅读教学策略初探[J]. 中学课程辅导(教师教育) 2019(19)
    • [28].浅谈古诗词群文阅读的议题设计[J]. 教育实践与研究(A) 2019(02)
    • [29].“玉”词群语义范畴及隐喻认知分析[J]. 现代语文(语言研究版) 2014(06)
    • [30].从“土豪金”类颜色词看现代网络流行词群的衍生模式及特点[J]. 现代语文(语言研究版) 2013(12)

    标签:;  ;  ;  ;  ;  ;  

    基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究
    下载Doc文档

    猜你喜欢