不平衡数据集论文
基于组合抽样技术的集成学习算法研究与应用
论文摘要不平衡数据集分类和集成学习是当今机器学习领域的主要研究内容。传统分类方法大多基于训练数据集各类样本的数目基本平衡和误分类代价相同等假设,以准确率为分类器性能评价指标,因...基于改进的SVM-KNN算法的中文网页层次式分类
论文摘要随着互联网进入Web2.0时代,Blog、SNS等新兴网络媒体日益流行起来,Web信息量出现爆炸性增长。面对Web上的海量数据,人们要想有效地获取自己所需要的信息已变得...语音识别置信度研究
论文摘要手机端的语音短信输入,可以免去人们手工输入短信的不便,有着实际的应用需求,但是尚未得到很好的解决。因此短信语音识别成为当前语音识别的一个热点问题。短信语音有语句短,口语...不平衡数据集上支持向量机算法研究
论文摘要支持向量机是由Vapnik等人提出的一种新的学习机器,它建立在统计学习理论基础之上,是处理小样本学习的有效工具,在文本自动分类、信号处理、手写数字识别、通讯等领域得到了...基于不平衡数据集的文本分类技术
论文摘要文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,但是在实际应用中,经常会出现文本实例中一些类中的文本很多,而另一些类中文本较少的情况,而这些应用往往就是为了预...