对于词汇增长数学模型的实证性研究

对于词汇增长数学模型的实证性研究

论文摘要

基于BNC笔语语料库,本文研究了八千万英语笔语的篇际词汇增长曲线,并对现有数学模型进行了拟合度检验。本文主要解决了关于篇际词汇增长的四个问题,即单独语篇的词汇量分布,八千万篇际词汇增长模型,篇际新增词汇的递减模式,以及新增词汇的词性分析。研究表明,长度约为2000单词的语篇词汇量呈正态分布,由此可以计算出语篇词汇量的95%双向置信区间值。在对八千万单词的语料样本进行了Brunet模型,Herdan-Heaps模型,Guiraud模型,Tuldava模型,以及K(?)hler,Martináková模型检验后,发现当语料样本大于五万单词而小于八千万词单词时,Herdan-Heaps模型能很精确的描述词汇增长曲线;而对于小于五万单词的语料样本,Tuldava模型则能很好的描述词汇增长曲线。篇际新增词汇随语料样本增大而呈现递减曲线,而这些新词在词性分布上有明显的特征。研究表明,除专有名词,阿拉伯数字,连字符构成的合成词,以及非单词字符会大大增加英语词汇量外,大量的普通名词,形容词,动词以及副词也是英语新增词汇的主要来源。这些单词都是造成词汇分布及词汇增长中LNRE现象的主要原因。

论文目录

  • 摘要
  • Abstract
  • Chapter One Introduction
  • 1.1 Background of Vocabulary Study
  • 1.2 Objective of This Paper
  • 1.3 Significance of This Paper
  • 1.4 Research Method
  • 1.5 Related Concepts
  • 1.5.1 Token and Type
  • 1.5.2 Word Family and Lemma
  • 1.5.3 Tokenization and Lemmatization
  • 1.6 Layout of the Thesis
  • Chapter Two Theoretical Background
  • 2.1 Zipfs Law
  • 2.2 Characteristic Constants
  • 2.3 Lexical Growth Models
  • 2.3.1 Guiraud's Model
  • 2.3.2 Brunet's Model
  • 2.3.3 Kohler-Martináková's Model
  • 2.3.4 Tuldava's Model
  • 2.3.5 Herdan-Heaps'Model
  • 2.3.6 Fan's Model Test
  • 2.4 LNRE Zone
  • Chapter Three Data Collection and Processing
  • 3.1 Corpus Description
  • 3.2 Tools for Data Processing
  • 3.3 Procedures for Data Processing
  • Chapter Four Results and Analysis
  • 4.1 Vocabulary Size Distributions of Individual Texts
  • 4.2 Inter-textual Vocabulary Growth Pattern
  • 4.2.1 Test of Vocabulary Growth Models for 50000≤N≤80000000
  • 4.2.2 Analysis of Residual Errors for Existing Models
  • 4.2.3 Calculation of Parameters
  • 4.2.4 Vocabulary Growth Pattern for N≤50000
  • 4.3 Decreasing Pattern of Newly Occurring Words
  • 4.4 Analysis of Newly Occurring Words
  • 4.5 Discussion
  • Chapter Five Conclusion
  • 5.1 Major Findings of the Study
  • 5.2 Suggestions for Further Study
  • Reference
  • Appendix A
  • Program for Random Sampling
  • Program for Tokenization
  • Program for Calculating V(N) and Vj against N
  • Program for Obtaining Part of Speech Data on the Newly Occurring Words
  • Appendix B
  • Part of the Newly Occurring Words Brought by 2 Million Words Input into the 80 Million Words(Initial Letter A)
  • Acknowledgements
  • Resume
  • 相关论文文献

    • [1].关于阅读与词汇积累的几点建议[J]. 首都外语论坛 2016(00)
    • [2].词汇教学过程中的生命化追求[J]. 考试与评价 2019(11)
    • [3].运用“多模态法”进行词汇教学的探究[J]. 中学课程辅导(教师教育) 2019(23)
    • [4].模块词汇整体教学让单词不再“孤单”[J]. 考试周刊 2019(99)
    • [5].合作学习在小学英语词汇教学中的运用研究[J]. 校园英语 2020(02)
    • [6].浅析情境教学法在小学英语词汇教学中的应用设计[J]. 小学时代 2019(29)
    • [7].英汉饮食词汇的隐喻与合理应用分析[J]. 校园英语 2020(03)
    • [8].找准策略,为词汇教学助力[J]. 中学生英语 2020(04)
    • [9].思维导图在小学英语词汇教学中的应用[J]. 中学生英语 2020(06)
    • [10].浅析如何在初中英语阅读教学中实现有效地教学词汇[J]. 考试周刊 2020(22)
    • [11].刍议小学英语词汇教学的开展[J]. 英语画刊(高级版) 2020(03)
    • [12].情境教学法在小学英语词汇教学中的有效应用探究[J]. 考试周刊 2020(21)
    • [13].词块理论与高考词汇复习教学[J]. 考试与评价 2020(03)
    • [14].浅谈如何让初中词汇教学更加生动有效[J]. 考试周刊 2020(26)
    • [15].小学英语词汇教学中的问题与对策探究[J]. 校园英语 2020(07)
    • [16].小学生成语和词汇的掌握对学习的重要意义[J]. 小学生作文辅导(上旬) 2020(03)
    • [17].词汇典藏屋[J]. 课堂内外(小学版) 2020(03)
    • [18].词汇病了[J]. 长江丛刊 2020(13)
    • [19].论提高小学英语词汇教学质量的策略[J]. 中华少年 2020(10)
    • [20].词汇典藏屋[J]. 课堂内外(小学版) 2020(05)
    • [21].让词汇教学“活”起来[J]. 吉林教育 2020(18)
    • [22].基于词典学的法语词汇教学探讨[J]. 山西青年 2020(14)
    • [23].依托文本优化词汇教学[J]. 试题与研究 2020(19)
    • [24].谈词汇学习[J]. 新世纪智能 2020(ZF)
    • [25].词汇典藏屋[J]. 课堂内外(小学版) 2020(06)
    • [26].小学英语词汇教学的可视化策略研究[J]. 英语画刊(高级版) 2020(11)
    • [27].思维导图在英语词汇教学中的应用探究[J]. 高考 2020(32)
    • [28].放眼世界 聚焦课堂 因时因事 巧教活学——高三英语词汇复习的方法[J]. 教学考试 2020(30)
    • [29].论“小纸条”在高三词汇复习中的妙用[J]. 求学 2020(04)
    • [30].小学英语词汇教学的有效方法新探[J]. 天天爱科学(教学研究) 2020(08)

    标签:;  ;  ;  ;  

    对于词汇增长数学模型的实证性研究
    下载Doc文档

    猜你喜欢