基于综合评价理论的多分类器容器

基于综合评价理论的多分类器容器

论文摘要

分类是数据挖掘中一项非常重要的任务,目前在商业上应用最多。分类的目的是提出一个分类函数或分类模型(也常常称做分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。大量的统计方法和机器学习方法被应用于自动文本分类。自动文本分类分为三个过程:首先对文本进行预处理,将文本数字化;接着构造并训练分类器;最后用分类器对新文本进行分类。本文根据对以往传统的分类方法的研究,特别是每一个分类器对于不同类别的区分程度不同,提出一种基于综合评价理论的多分类器综合方法,旨在利用各个子分类器对于不同类别的区分度不同,互相取长补短,评价模型使用了线性加权模型,把多个分类器综合和在一个容器内。训练过程参照了优化理论中的直接搜索方法。形成一个容纳多个分类器的容器。文本预处理过程中,首先通过对几种特征抽取方法的比较,选取一种最适合本系统的方法;其次选取一种合适的权重计算方法,最后把文本表示成向量的形式。在分类器的训练过程中,首先构造了四个子分类器,利用复旦大学提供的语料进行测试分析,再根据综合评价理论构造分类容器,对分类容器进行训练时,得出各个子分类器的类别权值,即权值矩阵。分类器测试时,先用子分类器对文本进行判别,再利用权值矩阵,运用集值迭代的方法进行加权求和,最后取和最大的类做为类别归属。这个容器是各个分类器的一个优化的组合,实验结果表明,这个容器确实得到了比较理想的分类效果。本文中用到的方法有SVM分类方法、贝叶斯分类方法、简单向量距离法和多组判别分析法。

论文目录

  • 摘要
  • Abstract
  • 引言
  • 1绪论
  • 1.1文本分类的发展史
  • 1.2文本分类常用的方法
  • 1.3分类方法的性能评估
  • 1.4课题涉及的主要研究内容
  • 1.5论文的组织
  • 2文本分类过程
  • 2.1文本向量化
  • 2.2分类器的训练
  • 2.3分类器的测试
  • 2.4分类器综述
  • 3本文涉及到的分类方法
  • 3.1简单向量距离方法
  • 3.1.1CG分类的原理
  • 3.1.2CG的训练过程
  • 3.1.3CG的测试
  • 3.2贝叶斯分类方法
  • 3.2.1贝叶斯分类的原理
  • 3.2.2贝叶斯的训练过程
  • 3.2.3贝叶斯的测试
  • 3.3支撑向量机(SVM:Support Vector Machine)分类方法
  • 3.3.1SVM分类的原理
  • 3.3.2SVM的训练过程
  • 3.3.3SVM的测试
  • 3.4多组判别分析方法
  • 3.4.1MG分类的原理
  • 3.4.2MG的训练过程
  • 3.4.3MG的测试
  • 4系统总体设计
  • 4.1系统设计目标
  • 4.2系统设计思想
  • 4.3系统体系结构
  • 5系统设计和实现
  • 5.1文本处理
  • 5.1.1分词
  • 5.1.2特征抽取
  • 5.1.3文本表示
  • 5.2分类器的训练
  • 5.2.1SVM分类器的训练
  • 5.2.2贝叶斯分类器的训练
  • 5.2.3多组判别方法分类器的训练
  • 5.2.4简单向量距离法分类的训练
  • 5.2.5综合分类器的训练
  • 5.3系统分析
  • 5.4分类器的测试结果
  • 结论
  • 研究工作小结
  • 研究工作的展望
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 大连理工大学学位论文版权使用授权书
  • 相关论文文献

    • [1].基于动态分类器集成系统的卷烟感官质量预测方法[J]. 计算机应用与软件 2020(01)
    • [2].基于标准数据集的分类器融合学习模型[J]. 微型电脑应用 2020(04)
    • [3].一种自适应子融合集成多分类器方法[J]. 计算机测量与控制 2019(04)
    • [4].基于多分类器融合的近红外光谱技术鉴别蜂蜜品种[J]. 化学分析计量 2019(03)
    • [5].基于分类器的身份证号码识别研究[J]. 贵州科学 2018(01)
    • [6].一种基于多分类器融合的人体运动行为识别模型[J]. 计算机科学 2016(12)
    • [7].一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版) 2017(02)
    • [8].一种代价敏感的三类分类器评估方法的研究与应用[J]. 通化师范学院学报 2017(08)
    • [9].基于多分类器组合的遥感土地利用分类研究[J]. 安徽农业科学 2015(32)
    • [10].多分类器融合与单分类器影像分类比较研究[J]. 矿山测量 2016(04)
    • [11].《未来垃圾分类器》[J]. 幼儿教育 2020(14)
    • [12].基于多分类器组合的城市不透水面提取研究[J]. 城市地理 2017(04)
    • [13].《垃圾分类器》[J]. 辅导员 2016(11)
    • [14].基于一种新的级联分类器的目标检测系统[J]. 现代电子技术 2020(01)
    • [15].最佳的分类器链局部检测与挖掘算法[J]. 计算机工程与设计 2017(11)
    • [16].基于多分类器融合与模糊综合评判的滚动轴承故障诊断[J]. 中国科技论文 2016(04)
    • [17].近红外光谱和多分类器融合的葡萄酒品种判别研究[J]. 光谱学与光谱分析 2016(11)
    • [18].基于多分类器集成的语音情感识别[J]. 微电子学与计算机 2015(07)
    • [19].基于集成分类器的流量识别技术研究[J]. 科技视界 2015(33)
    • [20].二叉树型多分类器融合的轴承故障诊断方法[J]. 计算机工程与应用 2015(21)
    • [21].智能垃圾分类器[J]. 科学启蒙 2013(12)
    • [22].一种新的多分类器融合方法[J]. 西南师范大学学报(自然科学版) 2014(01)
    • [23].动态加权投票的多分类器聚合[J]. 现代计算机(专业版) 2014(05)
    • [24].面向用户观点分析的多分类器集成和优化技术[J]. 计算机学报 2013(08)
    • [25].基于证据理论的优化集成分类器融合算法及应用[J]. 化工学报 2012(09)
    • [26].多类不平衡数据上的分类器性能比较研究[J]. 计算机工程 2011(10)
    • [27].基于多分类器融合的语音识别方法研究[J]. 重庆邮电大学学报(自然科学版) 2011(04)
    • [28].基于粗糙集约简的多分类器系统构造方法[J]. 计算机工程与应用 2010(03)
    • [29].面向对象森林分类的多分类器结合方法研究[J]. 南京林业大学学报(自然科学版) 2010(01)
    • [30].选择分类器进行入侵检测[J]. 微计算机信息 2010(06)

    标签:;  ;  ;  

    基于综合评价理论的多分类器容器
    下载Doc文档

    猜你喜欢