论文摘要
粗糙集和支持向量机都是为了从数据中提取固定模式而提出的数据挖掘方法。粗糙集理论适用于海量数据,支持向量机是在统计学习理论基础上提出的分类方法,它的结构风险最小化准则和核函数理论,避免了“维数灾难”和“过学习”等传统方法的缺点。本文将粗糙集和支持向量机相结合,利用两种方法的优越性,提出了一种先用粗糙集进行预处理,再用支持向量机精确分类的方法。本文首先介绍了粗糙集和支持向量机的基本理论,对粗糙集的下近似、上近似、决策规则以及支持向量机的结构风险最小化原则、核函数等理论做了简要的回顾,分析了两种方法在数据挖掘领域的优势和局限性。然后,针对以往连续属性离散化方法分类规则复杂、会丢失大量信息的问题,提出了基于粗糙集下近似理论的离散化方法。这种方法可以对海量数据进行预处理,将根据粗糙集理论肯定属于某一类别的样本提出,并删除样本数据中可能的噪音数据,得到部分决策规则。这种方法不会破坏原数据集的不可分辨关系,而且得到的分类规则简洁。接着,利用支持向量机方法只与支持向量有关的特点和能够精确分类的优势,将经过粗糙集预处理的数据用支持向量机方法精确分类。最后,仿真实验表明,该方法在缩短训练时间的基础上,保留了支持向量机方法所需的分类信息,去除了样本数据中的噪音数据,提高了分类精度,克服了SVM算法的应用瓶颈。
论文目录
相关论文文献
- [1].一种结合二元蚁群和粗糙集的连续属性离散化算法[J]. 计算机科学 2017(09)
- [2].基于粒度商的连续属性离散化方法[J]. 阜阳师范学院学报(自然科学版) 2015(04)
- [3].连续属性离散化研究[J]. 电脑知识与技术 2011(02)
- [4].一种基于条件熵的粗糙集连续属性离散化方法[J]. 科学技术与工程 2010(15)
- [5].一种监督型的连续属性离散化算法的研究[J]. 三明学院学报 2015(04)
- [6].决策表连续属性离散化的一种方法[J]. 计算机工程与应用 2008(30)
- [7].基于杂度削减的连续属性离散化方法[J]. 统计与决策 2012(05)
- [8].基于词出现和信息增益的连续属性离散化方法[J]. 计算机应用研究 2009(02)
- [9].一种基于遗传算法的连续属性离散化方法[J]. 钦州学院学报 2008(06)
- [10].一种基于条件熵的粗糙集连续属性离散化方法[J]. 现代制造工程 2009(03)
- [11].基于决策强度的决策表连续属性离散化算法[J]. 电脑知识与技术 2008(34)
- [12].基于信息增益的多连续属性离散化算法改进[J]. 江西科学 2009(02)
- [13].基于粗糙集的连续属性离散化算法及其应用[J]. 高师理科学刊 2008(02)
- [14].连续属性离散化算法研究综述[J]. 计算机应用与软件 2014(08)
- [15].一种新的基于连续属性离散化的属性约简方法[J]. 计算机应用研究 2009(01)
- [16].一种基于差别矩阵的粗糙集连续属性离散化算法[J]. 现代电子技术 2010(24)
- [17].粗糙集理论中连续属性离散化的一种新方法[J]. 实验室研究与探索 2008(08)
- [18].一种基于连续属性离散化的知识分类方法[J]. 东北师大学报(自然科学版) 2012(01)
- [19].一种新的无监督连续属性离散化方法[J]. 计算机工程与应用 2011(06)
- [20].粗糙集连续属性离散化的k均值方法[J]. 辽宁工程技术大学学报(自然科学版) 2015(05)
- [21].基于Shadowed Sets的连续属性离散化[J]. 模糊系统与数学 2012(02)
- [22].不确定信息系统的属性离散化模型[J]. 河北理工大学学报(自然科学版) 2010(04)
- [23].一种新的基于粗糙集的连续属性离散化算法[J]. 火力与指挥控制 2009(12)
- [24].基于聚类的决策树连续属性离散化改进算法[J]. 微计算机信息 2011(06)
- [25].基于Cramer's V的连续属性离散化算法[J]. 计算机工程 2008(04)
- [26].粗糙集连续属性离散化通用模型及GASA方法[J]. 兰州理工大学学报 2011(01)
- [27].一种基于SOFM网络的连续属性离散化方法[J]. 福建电脑 2013(07)
- [28].基于FCM的连续属性模糊离散化方法[J]. 福建电脑 2013(03)
- [29].基于连续属性离散化和SVM的分类预测方法[J]. 科技创新导报 2010(15)
- [30].基于AHTPSO的连续属性离散化算法[J]. 计算机工程与科学 2016(05)