增量学习朴素贝叶斯中文分类系统的研究

增量学习朴素贝叶斯中文分类系统的研究

论文摘要

随着Internet的飞速发展,文本信息成几何级增长。为了能在海量的文本中及时准确地获得有效的知识和信息,文本分类技术受到了广泛的关注。朴素贝叶斯分类是目前公认的一种简单有效的概率分类方法,但是它不具备增量学习的功能。针对这种情况,本文提出改进的增量学习朴素贝叶斯算法。本文详细介绍了增量学习思路与增量学习朴素贝叶斯算法,并设计了一个增量朴素贝叶斯中文分类实验系统。论文的主要内容包括如下几个方面:1.描述了文本分类的一般过程,介绍了多种贝叶斯分类方法,对比研究分析其联系与差别。2.对特征选择算法进行深入分析,提出一种结合特征项在各类别中的分布信息的改进的TFIDF特征选择方法。实验证明改进的方法选择出的特征有更强的类别表达能力。3.针对朴素贝叶斯分类不具备增量学习的缺陷,提出增量学习朴素贝叶斯算法。详细介绍了增量学习思路,提出带选择性对文本进行增量学习的思想。在此基础上提出加权朴素贝叶斯方法增量学习算法,并对算法给出了详细证明与分析。4.设计了一个增量朴素贝叶斯中文分类实验系统,使用两个中文数据集进行实验。实验结果表面,带增量学习的朴素贝叶斯分类方法在两个数据集上都比单纯的朴素贝叶斯分类效果要好。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 研究现状
  • 1.3 本文工作
  • 1.4 本文的组织结构
  • 第二章 文本自动分类技术概述
  • 2.1 文本自动分类技术
  • 2.1.1 文本自动分类的定义
  • 2.1.2 文本预处理
  • 2.1.3 文本表示
  • 2.1.4 特征加权算法
  • 2.1.5 部分文本分类方法
  • 2.2 贝叶斯分类方法
  • 2.2.1 贝叶斯理论
  • 2.2.2 贝叶斯分类方法
  • 2.2.3 朴素贝叶斯分类的缺陷
  • 2.3 增量学习朴素贝叶斯分类
  • 2.3.1 增量学习机制
  • 2.3.2 增量学习在分类中的应用
  • 2.3.3 增量学习贝叶斯分类分析
  • 2.4 本章小结
  • 第三章 改进的特征选择算法
  • 3.1 基本概念
  • 3.2 几种常用的特征选择算法
  • 3.3 算法类比实验
  • 3.4 改进的特征选择算法
  • 3.4.1 已有算法的不足
  • 3.4.2 一种改进的TFIDF特征选择算法
  • 3.5 实验结果及分析
  • 3.6 本章小结
  • 第四章 改进的增量学习朴素贝叶斯分类方法
  • 4.1 改进的增量朴素贝叶斯分类模型
  • 4.2 增量学习加权朴素贝叶斯分类算法
  • 4.3 增量学习公式的证明
  • 4.4 算法分析
  • 4.5 本章小结
  • 第五章 增量学习朴素贝叶斯中文分类实验系统
  • 5.1 系统框架设计与模块说明
  • 5.2 系统中的关键算法
  • 5.3 实验系统开发环境及分类语料
  • 5.3.1 实验系统开发环境
  • 5.3.2 实验语料库
  • 5.4 测试方法及评价标准
  • 5.4.1 测试方法
  • 5.4.2 实验评价标准
  • 5.5 测试结果分析
  • 5.6 本章小结
  • 第六章 总结与展望
  • 6.1 工作总结
  • 6.2 下一步展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间的主要研究成果
  • 相关论文文献

    • [1].基于主成分分析朴素贝叶斯和决策树比较[J]. 电脑知识与技术 2010(01)
    • [2].朴素贝叶斯方法在文本分类中的运用[J]. 电子技术与软件工程 2018(11)
    • [3].朴素贝叶斯判别的判别效用分析[J]. 生物数学学报 2010(02)
    • [4].朴素贝叶斯分类法与数据资产会计确认——难题与突破[J]. 会计之友 2019(19)
    • [5].基于朴素贝叶斯网络的微博话题追踪技术研究[J]. 计算机与数字工程 2017(11)
    • [6].基于朴素贝叶斯的学生发展预测研究[J]. 大连民族学院学报 2011(05)
    • [7].基于模糊聚类的混合朴素贝叶斯分类模型[J]. 安徽建筑工业学院学报(自然科学版) 2009(03)
    • [8].基于距离度量的局部加权朴素贝叶斯算法改进[J]. 电脑开发与应用 2009(10)
    • [9].基于上下文语义的朴素贝叶斯文本分类算法[J]. 计算机与现代化 2018(06)
    • [10].基于朴素贝叶斯的鼠标轨迹识别方法[J]. 信息通信 2018(09)
    • [11].基于模糊朴素贝叶斯方法的客户消费行为预测研究[J]. 湖南科技学院学报 2013(12)
    • [12].一种改进的朴素贝叶斯文本分类方法[J]. 华侨大学学报(自然科学版) 2011(04)
    • [13].朴素贝叶斯在文本分类上的应用[J]. 通讯世界 2019(01)
    • [14].基于朴素贝叶斯理论的高职院校软件项目实训综合评价研究[J]. 科技创新导报 2019(05)
    • [15].基于朴素贝叶斯的新闻分类改进[J]. 电子制作 2018(22)
    • [16].决策树、朴素贝叶斯和朴素贝叶斯树的比较[J]. 计算机系统应用 2012(12)
    • [17].基于改进的TF-IDF与隐朴素贝叶斯的情感分类研究[J]. 南华大学学报(自然科学版) 2019(02)
    • [18].一种基于多关系的朴素贝叶斯空间分类算法[J]. 云南民族大学学报(自然科学版) 2017(06)
    • [19].朴素贝叶斯方法在中文文本分类中的应用[J]. 中国高新科技 2019(07)
    • [20].保护隐私的分布式朴素贝叶斯挖掘[J]. 应用科学学报 2017(01)
    • [21].基于隐朴素贝叶斯的商品评论情感分类方法[J]. 计算机工程与设计 2017(01)
    • [22].一种基于朴素贝叶斯的银行卡批量业务预测方法[J]. 微型电脑应用 2017(11)
    • [23].云平台下基于半朴素贝叶斯的降雨量预测[J]. 系统仿真学报 2016(05)
    • [24].基于属性加权朴素贝叶斯的冠心病辨证模型[J]. 广西师范大学学报(自然科学版) 2008(04)
    • [25].基于特征加权的朴素贝叶斯学情预警分类研究[J]. 山西大同大学学报(自然科学版) 2019(02)
    • [26].一种基于树增强朴素贝叶斯的分类器学习方法[J]. 电子与信息学报 2019(08)
    • [27].基于朴素贝叶斯的农业文本分类方法研究[J]. 节水灌溉 2018(02)
    • [28].一种基于属性加权补集的朴素贝叶斯文本分类算法[J]. 哈尔滨理工大学学报 2018(04)
    • [29].特征提取方法对朴素贝叶斯文本分类器的影响分析[J]. 长江大学学报(自科版) 2013(25)
    • [30].基于内容的垃圾短信分类技术研究[J]. 信息与电脑(理论版) 2015(24)

    标签:;  ;  ;  ;  

    增量学习朴素贝叶斯中文分类系统的研究
    下载Doc文档

    猜你喜欢