基于支持向量机的数据挖掘应用研究

基于支持向量机的数据挖掘应用研究

论文摘要

数据挖掘是从大量、复杂的数据中迅速获取新颖、有效的知识的过程。支持向量机(support vector machine,SVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。它是在统计学习理论基础上发展起来的一种通用学习机器,具有全局最优、结构简单和推广能力强等优点。传统的支持向量机是一种有监督的机器学习算法,即要求训练样本的类别信息是已知的。但在将SVM应用到实际问题中时,经常只能获得少量的有标签样本,而大量的样本是没有标签的,这时传统的SVM算法在这类问题面前就无能为力了。为了解决这一问题,T.Joachims提出了直推式学习的方法TSVM(Transductive SupportVector Machine)。陈毅松等人对TSVM作了改进,提出了渐进直推式支持向量机PTSVM(Progressive Transductive Support Vector Machine)。本文对PTSVM作了进一步的改进,提出了基于离散度量的支持向量机SDSVM (Separation Degree Support Vector Machine)。该算法引入了Fisher准则中的样本离散度作为度量标准,利用Fisher准则函数作为评价函数,试图使算法在训练结束时能找到这样一个分割平面,使同类样本间尽量密集而不同类样本间距离尽量拉大。达到了降低了算法训练的时间复杂度和提高测试精度的目的。简单的支持向量机只能处理二值分类问题,不能直接处理多值分类问题。而现实世界中的大部分数据都是多类数据,所以需要对简单支持向量机作进一步扩展,使之能解决多值分类问题。本文介绍了几种用于多值分类的SVM算法,包括“一对多”、“一对一”、有向无环图SVM以及基于决策树的SVM,并比较了它们各自的优点和缺点。通过分析SDSVM的不足之处,对它作了进一步的改进,并将其成功与多值分类的SVM算法相结合。实验结果表明,SDSVM在应用于半监督的多值分类问题中取得了较好的性能。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 国内外的研究现状
  • 1.3 本文的研究内容及意义
  • 1.4 本文的结构安排
  • 第二章 数据挖掘理论与技术
  • 2.1 数据挖掘定义
  • 2.2 数据挖掘的功能
  • 2.3 数据挖掘过程
  • 2.4 分类算法综述
  • 2.4.1 决策树
  • 2.4.2 贝叶斯分类
  • 2.4.3 神经网络
  • 2.4.4 遗传算法
  • 2.5 分类模型性能的评估方法
  • 2.6 数据挖掘的应用
  • 2.7 本章小结
  • 第三章 统计学习理论与支持向量机
  • 3.1 机器学习的基本问题
  • 3.2 统计学习理论
  • 3.3 支持向量机
  • 3.3.1 广义最优分类面
  • 3.3.2 支持向量机原理
  • 3.3.3 非线性支持向量机与核函数
  • 3.4 对支持向量机的改进
  • 3.5 本章小结
  • 第四章 基于离散度量和SVM 相结合的半监督分类算法
  • 4.1 渐进直推式支持向量机
  • 4.1.1 直推式学习
  • 4.1.2 渐进直推式支持向量机
  • 4.2 基于离散度量和SVM 相结合的分类学习算法
  • 4.2.1 Fisher 线性准则
  • 4.2.2 基于离散度量的半监督分类算法
  • 4.3 实验结果与分析
  • 4.3.1 ionosphere 数据集上的实验
  • 4.3.2 wdbc 数据集上的实验
  • 4.4 本章小结
  • 第五章 半监督分类算法在多分类问题中的应用
  • 5.1 多分类支持向量机
  • 5.1.1 一对多(One-a-Rest)SVM
  • 5.1.2 一对一(One-a-One)SVM
  • 5.1.3 基于决策树的多类SVM
  • 5.1.4 基于有向无环图的多类SVM
  • 5.1.5 多类支持向量机
  • 5.2 SDSVM 算法的改进
  • 5.3 实验结果与分析
  • 5.3.1 yeast 数据集上的实验
  • 5.3.2 letter-recognition 数据集上的实验
  • 5.4 本章小结
  • 第六章 总结与展望
  • 6.1 研究结论
  • 6.2 研究展望
  • 致谢
  • 参考文献
  • 附录:作者在攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [2].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [3].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [4].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [5].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [6].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [7].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [8].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [9].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [10].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [11].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [12].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [13].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [14].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [15].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [16].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [17].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [18].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [19].浅析数据挖掘[J]. 内江科技 2020(06)
    • [20].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [21].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [22].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [23].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [24].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [25].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [26].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [27].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [28].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [29].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)
    • [30].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(10)

    标签:;  ;  ;  ;  ;  

    基于支持向量机的数据挖掘应用研究
    下载Doc文档

    猜你喜欢