论文摘要
分类是数据挖掘中一项非常重要的任务,目前在商业上应用最多。分类的目的是提出一个分类函数或分类模型(也常常称做分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。大量的统计方法和机器学习方法被应用于自动文本分类。自动文本分类分为三个过程:首先对文本进行预处理,将文本数字化;接着构造并训练分类器;最后用分类器对新文本进行分类。本文根据对以往传统的分类方法的研究,特别是每一个分类器对于不同类别的区分程度不同,提出一种基于综合评价理论的多分类器综合方法,旨在利用各个子分类器对于不同类别的区分度不同,互相取长补短,评价模型使用了线性加权模型,把多个分类器综合和在一个容器内。训练过程参照了优化理论中的直接搜索方法。形成一个容纳多个分类器的容器。文本预处理过程中,首先通过对几种特征抽取方法的比较,选取一种最适合本系统的方法;其次选取一种合适的权重计算方法,最后把文本表示成向量的形式。在分类器的训练过程中,首先构造了四个子分类器,利用复旦大学提供的语料进行测试分析,再根据综合评价理论构造分类容器,对分类容器进行训练时,得出各个子分类器的类别权值,即权值矩阵。分类器测试时,先用子分类器对文本进行判别,再利用权值矩阵,运用集值迭代的方法进行加权求和,最后取和最大的类做为类别归属。这个容器是各个分类器的一个优化的组合,实验结果表明,这个容器确实得到了比较理想的分类效果。本文中用到的方法有SVM分类方法、贝叶斯分类方法、简单向量距离法和多组判别分析法。
论文目录
相关论文文献
- [1].基于动态分类器集成系统的卷烟感官质量预测方法[J]. 计算机应用与软件 2020(01)
- [2].基于标准数据集的分类器融合学习模型[J]. 微型电脑应用 2020(04)
- [3].一种自适应子融合集成多分类器方法[J]. 计算机测量与控制 2019(04)
- [4].基于多分类器融合的近红外光谱技术鉴别蜂蜜品种[J]. 化学分析计量 2019(03)
- [5].基于分类器的身份证号码识别研究[J]. 贵州科学 2018(01)
- [6].一种基于多分类器融合的人体运动行为识别模型[J]. 计算机科学 2016(12)
- [7].一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版) 2017(02)
- [8].一种代价敏感的三类分类器评估方法的研究与应用[J]. 通化师范学院学报 2017(08)
- [9].基于多分类器组合的遥感土地利用分类研究[J]. 安徽农业科学 2015(32)
- [10].多分类器融合与单分类器影像分类比较研究[J]. 矿山测量 2016(04)
- [11].《未来垃圾分类器》[J]. 幼儿教育 2020(14)
- [12].基于多分类器组合的城市不透水面提取研究[J]. 城市地理 2017(04)
- [13].《垃圾分类器》[J]. 辅导员 2016(11)
- [14].基于一种新的级联分类器的目标检测系统[J]. 现代电子技术 2020(01)
- [15].最佳的分类器链局部检测与挖掘算法[J]. 计算机工程与设计 2017(11)
- [16].基于多分类器融合与模糊综合评判的滚动轴承故障诊断[J]. 中国科技论文 2016(04)
- [17].近红外光谱和多分类器融合的葡萄酒品种判别研究[J]. 光谱学与光谱分析 2016(11)
- [18].基于多分类器集成的语音情感识别[J]. 微电子学与计算机 2015(07)
- [19].基于集成分类器的流量识别技术研究[J]. 科技视界 2015(33)
- [20].二叉树型多分类器融合的轴承故障诊断方法[J]. 计算机工程与应用 2015(21)
- [21].智能垃圾分类器[J]. 科学启蒙 2013(12)
- [22].一种新的多分类器融合方法[J]. 西南师范大学学报(自然科学版) 2014(01)
- [23].动态加权投票的多分类器聚合[J]. 现代计算机(专业版) 2014(05)
- [24].面向用户观点分析的多分类器集成和优化技术[J]. 计算机学报 2013(08)
- [25].基于证据理论的优化集成分类器融合算法及应用[J]. 化工学报 2012(09)
- [26].多类不平衡数据上的分类器性能比较研究[J]. 计算机工程 2011(10)
- [27].基于多分类器融合的语音识别方法研究[J]. 重庆邮电大学学报(自然科学版) 2011(04)
- [28].基于粗糙集约简的多分类器系统构造方法[J]. 计算机工程与应用 2010(03)
- [29].面向对象森林分类的多分类器结合方法研究[J]. 南京林业大学学报(自然科学版) 2010(01)
- [30].选择分类器进行入侵检测[J]. 微计算机信息 2010(06)