支持向量机中若干问题及应用研究

支持向量机中若干问题及应用研究

论文摘要

统计学习理论为研究小样本情况下机器学习问题提供了有力的理论基础。它使用结构风险最小化原则,综合了统计学习、机器学习和神经网络等方面技术,在最小化经验风险的同时,有效地提高了算法泛化能力。支持向量机是在该理论体系下产生的一种新的、非常有力的机器学习方法。它较好地解决了以往困扰很多学习方法的小样本、非线性、过学习、高维数、局部极小点等实际问题,具有良好的潜在应用价值和发展前景。目前,统计学习理论和支持向量机作为小样本学习的最佳理论,受到越来越广泛的重视,成为人工智能和机器学习领域新的研究热点。本文综述了支持向量机的研究现状,针对目前存在的几个问题:不平衡调整问题、大样本减样和除噪问题、两种支持向量算法即Support Vector Machines(或SVM)与Support Vector Domain Description(或SVDD)的结合问题、核心向量的性能和应用问题以及SVDD算法在不确定型决策中的应用等问题进行研究。本文的主要工作如下:1.研究了不平衡支持向量机的调整方法。不平衡数据集的学习问题被公认为机器学习领域的难题之一,其困难主要来自于不平衡数据集本身的特点:例如,样本数量少的类其样本不足,样本的分布并不能很好地反映整个类的实际分布。因此标准支持向量机在应用于不平衡数据集时,往往把少数类的样本错分,尽管整体的分类精度比较高,但数量少的类的分类精度非常低。本文针对支持向量机中两类不平衡数据的分离超平面提出一种调整算法。该算法根据样本投影分布和样本容量所提供的信息给出两类惩罚因子比例,从而得到一个新的分离超平面。实验结果显示了该方法的良好性能。2.研究了样本的减样和除噪问题。在使用支持向量机分类时,存在以下两个问题:一是当两类训练样本中存在野点(噪点)时,分类的精度较低;二是对大规模样本集,所占用的内存空间较大,训练时所需时间较长。针对以上问题,我们分别基于欧氏距离和核距离,根据概率论的知识定位分析了野点(噪点)及多余样本点的一般比例情况,给出一种减样方法。实验结果表明该方法与标准SVM相比,能保持或提高分类精度;对于大样本来说不仅能保持精度不减,而且还能较大地提高分类速度,具有较强的实用性。3.将支持向量机与支持向量域描述结合起来,提出一种分类器。支持向量机在学习阶段,所有样本参加训练,因此需要较大的内存空间和较长的训练时间;而支持向量域分类器(Support Vector Domain Classifier,或SVDC),只训练一类样本点,因此,分类时训练时间较短,但精度较低。为了减少SVM的训练时间,提高SVDC的精度,我们建立一种新的分离超平面,即基于支持向量域的分离超平面。该算法是从整体上考虑分类信息,实现了SVDD和SVM的结合。实验结果显示了该方法的有效性。4.提出了核心向量的重要概念,并把核心向量集应用于支持向量机的改进。为了有效提取样本类信息,基于SVDD算法依据参数选择,剔除支持向量,找核心向量。为了研究核心向量的性能,分别使用线性以及径向基核函数对样本数据进行描述,从理论上证明了核心向量在样本集中,在对应参数下具有最大密度值,因而得出核心向量包含最大信息量的重要结论。因此,核心向量不仅可以作为样本的期望点估计,而且可以提炼控制向量,改善SVM的分类效果。5.将支持向量域描述算法应用在不确定型群决策中。分别研究了模糊判断和区间判断两种逆判问题。对于模糊判断的逆判问题,是以模糊互反判断为准,使用SVDD算法,寻找公共信息,根据信息的贡献量决定专家的评判权重。对于区间判断的逆判问题,通过对区间判断矩阵的点向量分解,采用径向基核函数,使用SVDD算法提取群体的公共信息,同样根据信息贡献量决定专家的权重。该研究充分利用了SVDD的描绘功能,抓住主要信息,比较适合于不确定型的群决策问题。它不仅开拓了SVDD的研究领域,而且为不确定型群决策的研究提供了有效的技术。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 支持向量机
  • 1.3 支持向量机的研究现状
  • 1.4 论文的研究目的、意义和主要内容
  • 1.5 全文内容安排
  • 第二章 不平衡支持向量机的调整方法
  • 2.1 不平衡支持向量机的研究现状
  • 2.2 类惩罚代价不同的不平衡支持向量机
  • 2.3 精确度的评价方法
  • 2.4 特征提取平衡算法(FEBM)
  • 2.5 本章小结
  • 第三章 基于距离的减样方法
  • 3.1 减样问题
  • 3.2 理论知识
  • 3.3 基于欧氏距离的减样方法(EDDM)
  • 3.4 基于距离性核函数的减样方法(KDDM)
  • 3.5 比较
  • 3.6 本章小结
  • 第四章 基于支持向量域描述的分离超平面
  • 4.1 问题背景
  • 4.2 支持向量域描述(SVDD)
  • 4.3 支持向量域分离超平面(SVDSH)
  • 4.4 实验
  • 4.5 本章小结
  • 第五章 基于 SVDD 的核心向量集及其在 SVM 中的应用
  • 5.1 问题背景
  • 5.2 基于 SVDD 的核心向量集
  • 5.3 Parzen 窗密度简介
  • 5.4 核心向量的性能
  • 5.5 实验
  • 5.6 核心向量的应用
  • 5.7 本章小结
  • 第六章 SVDD 算法在不确定型群决策中的应用
  • 6.1 不确定型群决策的现状和问题
  • 6.2 AHP 的基本概念
  • 6.3 逆判问题的研究
  • 6.4 本章小结
  • 结束语
  • 致谢
  • 参考文献
  • 攻读博士学位期间的研究成果
  • 附录
  • 相关论文文献

    • [1].用于短期风速预测的优化核心向量回归模型[J]. 中国电力 2012(03)
    • [2].基于壳向量和中心向量的支持向量机[J]. 数据采集与处理 2009(03)
    • [3].一种基于自适应重心向量的主题检测方法[J]. 计算机工程 2009(03)
    • [4].基于最小距离的多中心向量的增量分类算法[J]. 电脑知识与技术 2015(04)
    • [5].面向大规模样本的核心向量回归电力负荷快速预测方法[J]. 中国电机工程学报 2010(28)
    • [6].基于类中心向量的论文作者归属机构自动识别方法研究[J]. 情报学报 2019(07)
    • [7].中心向量夹角间隔正则化核向量机[J]. 信息与控制 2015(02)
    • [8].心电图与心向量联合检查对心肌缺血诊断的价值[J]. 中国实用医药 2011(35)
    • [9].三角形四心向量结论及其应用[J]. 中学生数学 2019(09)
    • [10].心电图讲座 第1讲 心向量图与心电图的关系[J]. 中国临床医生 2011(02)
    • [11].基于核心向量机的多任务概念漂移数据快速分类[J]. 智能系统学报 2018(06)
    • [12].三角形四心向量一般形式的探究[J]. 数学教学通讯 2010(03)
    • [13].农业信息分类中K-means与SVM的混合算法研究[J]. 计算机技术与发展 2017(06)
    • [14].基于改进相似度与类中心向量的半监督短文本聚类算法[J]. 计算机工程与科学 2018(09)
    • [15].一种基于L2-SVM的多视角核心向量机[J]. 控制与决策 2015(08)
    • [16].基于优化类中心分类算法的文本分类研究[J]. 科技传播 2011(18)
    • [17].例谈“奔驰定理”与三角形五心向量统一表示的应用[J]. 数学通讯 2017(21)
    • [18].改进的话题检测和跟踪算法研究[J]. 计算机技术与发展 2014(09)
    • [19].基于释义扩展的术语归类研究[J]. 中文信息学报 2016(01)
    • [20].核心向量机的电站锅炉NO_x排放特性大数据建模[J]. 中国电机工程学报 2016(03)
    • [21].改进的中心向量算法在农业信息分类中的研究[J]. 计算机技术与发展 2016(08)
    • [22].电轴左偏对左前分支传导阻滞诊断的研究[J]. 中国实用医药 2010(02)
    • [23].SVM的快速分类及其算法[J]. 焦作师范高等专科学校学报 2009(04)
    • [24].基于响应轨迹和核心向量机的电力系统在线暂态稳定评估[J]. 中国电机工程学报 2014(19)
    • [25].基于神经网络的传感器网络数据融合技术研究[J]. 计算机仿真 2011(10)
    • [26].基于中心向量KNN算法的改进[J]. 哈尔滨师范大学自然科学学报 2017(02)
    • [27].基于光束角思想的最大间隔学习机[J]. 控制与决策 2012(12)
    • [28].基于改进核心向量机的配电网理论线损计算方法[J]. 中国电机工程学报 2011(34)
    • [29].1000MW机组塔式炉炉内烧偏问题治理研究[J]. 动力工程学报 2015(11)
    • [30].活用三角形外心向量性质解向量问题[J]. 数学通讯 2014(Z4)

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

    支持向量机中若干问题及应用研究
    下载Doc文档

    猜你喜欢