模式识别中的样本选择研究及其应用

模式识别中的样本选择研究及其应用

论文摘要

随着信息科技的发展,人们需要处理的信息数据日渐呈现出高维和海量的特点。然而,随之而来的困扰是如何有效地分析和利用这些数据。这是模式识别、数据挖掘、神经网络、机器学习等学科所共同面临的问题。在统计模式识别中,许多分类方法的计算复杂度随着训练集样本个数的增加而快速增长。因此对于较大规模数据的处理常常陷入困难。一个直接有效的解决途径就是在保证学习算法分类性能的前提下,通过样本选择来约简训练样本集。样本选择既可以起到降低算法计算代价,加快学习速度的作用,也可能避免“过拟合”现象的发生,从而提高分类算法的泛化能力。本文针对分类决策与训练样本凸包有关的一类分类器,包括线性支持向量机、非线性支持向量机、最近邻凸包分类器和核最近邻凸包分类器,提出了几种样本选择方法,并通过实验分别对它们的有效性进行了验证。本文首先提出了子类凸包样本选择方法。该方法针对一类训练样本,通过迭代逐一选择距离选择集凸包最远的样本,从而使得选择集凸包尽可能地逼近原凸包。经证明,该方法选择的样本为原训练集凸包边缘点。本文将该样本选择方法分别与线性支持向量机和最近邻凸包分类器相结合,并取得了良好的实验效果。本文将核函数方法与子类凸包样本选择算法相结合,提出了核子类凸包样本选择方法。该方法利用核函数替代子类凸包样本选择算法中的内积运算,从而巧妙的在特征空间中实现了子类凸包样本选择的过程。本文将该样本选择方法分别用于非线性支持向量机和核最近邻凸包分类器的训练集约简。实验结果表明,由该样本选择方法选择的少量样本可以有效地支撑非线性支持向量机和核最近邻凸包分类器分类。本文提出子空间样本选择方法。该样本选择方法同样是一种类内样本选择方法,通过迭代逐一选择那些到已选样本集张成子空间距离最远的样本。经证明,该方法选择的样本不但是原训练集样本凸包的边缘点,而且彼此线性无关。本文将该样本选择方法应用于线性支持向量机。实验表明,该方法选择的样本在保持线性支持向量机较高识别性能的前提下,使得分类器的训练和测试时间明显缩短。本文在子空间样本选择方法的基础上,引入核函数,形成核子空间样本选择方法。首先通过非线性映射将各类别训练样本映射到特征空间,然后在该空间内执行与子空间样本选择方法相同的选样过程。在验证实验中,该方法为非线性支持向量机选择样本。在保持分类器泛化能力的同时,该方法选择样本少,选样速度快,表现出了明显的比较优势。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 模式识别
  • 1.2 样本选择研究
  • 1.3 样本选择方法
  • 1.3.1 基于统计抽样思想的方法
  • 1.3.2 基于最近邻编辑规则的方法
  • 1.3.3 基于示例学习的方法
  • 1.3.4 支持向量机的样本选择方法
  • 1.4 样本选择的评价
  • 1.5 本文的研究成果
  • 1.6 论文结构安排
  • 第二章 相关知识
  • 2.1 核函数方法
  • 2.2 支持向量机
  • 2.2.1 最优分类超平面
  • 2.2.2 广义最优分类超平面与核函数的引入
  • 2.2.3 支持向量机几何解释
  • 2.2.4 支持向量机的多类别分类
  • 2.2.5 改进的支持向量机优化方法
  • 2.3 最近邻凸包分类器
  • 2.4 核最近邻凸包分类器
  • 2.5 本章小结
  • 第三章 子类凸包样本选择方法及其应用
  • 3.1 引言
  • 3.2 子类凸包样本选择方法
  • 3.2.1 子类凸包样本选择算法
  • 3.2.2 选择样本的凸包边缘性
  • 3.3 子类凸包样本选择方法用于线性支持向量机
  • 3.3.1 子类凸包样本选择方法用于线性支持向量机
  • 3.3.2 实验与分析
  • 3.3.3 小结
  • 3.4 基于子类凸包样本选择方法的最近邻凸包分类器
  • 3.4.1 基于子类凸包样本选择方法的最近邻凸包分类器
  • 3.4.2 实验与分析
  • 3.4.3 小结
  • 3.5 本章小结
  • 第四章 核子类凸包样本选择方法及其应用
  • 4.1 引言
  • 4.2 核子类凸包样本选择方法
  • 4.3 核子类凸包样本选择方法用于非线性支持向量机
  • 4.3.1 核子类凸包样本选择方法用于非线性支持向量机
  • 4.3.2 实验与分析
  • 4.3.3 小结
  • 4.4 基于核子类凸包样本选择方法的核最近邻凸包分类器
  • 4.4.1 基于核子类凸包样本选择方法的核最近邻凸包分类器
  • 4.4.2 实验与分析
  • 4.4.3 小结
  • 4.5 本章小结
  • 第五章 子空间样本选择方法及其支持向量机应用
  • 5.1 引言
  • 5.2 子空间样本选择方法
  • 5.2.1 相关定理
  • 5.2.2 子空间样本选择算法
  • 5.2.3 选择样本的凸包边缘性和线性无关性
  • 5.3 子空间样本选择方法用于线性支持向量机
  • 5.3.1 子空间样本选择方法用于线性支持向量机
  • 5.3.2 实验与分析
  • 5.4 本章小结
  • 第六章 核子空间样本选择方法及其支持向量机应用
  • 6.1 引言
  • 6.2 核子空间样本选择方法
  • 6.3 核子空间样本选择方法用于非线性支持向量机
  • 6.3.1 核子空间样本选择方法用于非线性支持向量机
  • 6.3.2 实验与分析
  • 6.4 本章小结
  • 结束语
  • 致谢
  • 参考文献
  • 附录
  • 相关论文文献

    • [1].江西石城县通天寨龟裂凸包景观成因初探[J]. 东华理工大学学报(社会科学版) 2013(03)
    • [2].基于快速凸包的目标车辆动态围堵算法[J]. 科学技术与工程 2020(02)
    • [3].基于新型凸包法的平面度误差评定[J]. 组合机床与自动化加工技术 2016(04)
    • [4].旋转坐标系解凸包问题的方法研究[J]. 中国新通信 2012(15)
    • [5].基于凸包改进的流行排序显著性检测[J]. 计算机辅助设计与图形学学报 2019(05)
    • [6].基于夹角的凸包算法改进[J]. 软件导刊 2018(04)
    • [7].平面上的凸包计算[J]. 中国信息技术教育 2020(21)
    • [8].一种改进的最小凸包生成算法[J]. 大地测量与地球动力学 2011(03)
    • [9].一种新的最小凸包算法及其应用[J]. 地理与地理信息科学 2009(05)
    • [10].初始凸包对改进快速凸包算法效率的影响[J]. 测绘科学 2016(07)
    • [11].基于循环链表的凸包增量算法研究与实现[J]. 现代计算机(专业版) 2014(11)
    • [12].选择性自适应k子凸包分类方法[J]. 南京大学学报(自然科学版) 2013(04)
    • [13].超高强梁类零件凸包的辊冲成形工艺分析[J]. 模具工业 2019(05)
    • [14].战争问题的凸包判定算法[J]. 福建电脑 2019(09)
    • [15].快速凸包并行设计与研究[J]. 软件 2018(06)
    • [16].一种改进的快速三维凸包生成算法及实现[J]. 计算机工程与科学 2011(02)
    • [17].k子凸包分类方法[J]. 山西大学学报(自然科学版) 2011(03)
    • [18].涡轮叶片凸包强化传热的数值仿真研究[J]. 计算机仿真 2011(11)
    • [19].模型适应的凸包围多面体并行生成算法[J]. 中国科学:信息科学 2014(12)
    • [20].基于度量学习的邻域k凸包集成方法[J]. 合肥工业大学学报(自然科学版) 2013(02)
    • [21].平面散乱点集凸包的快速生成算法[J]. 工程图学学报 2008(04)
    • [22].一种高效的组团或自然村覆盖范围凸包生成算法[J]. 电信科学 2018(S1)
    • [23].振动凸包控制低雷诺数高负荷低压涡轮叶栅层流分离的数值研究[J]. 推进技术 2019(02)
    • [24].基于3D区域增长法和改进的凸包算法相结合的全肺分割方法[J]. 电子与信息学报 2016(09)
    • [25].计算机位图的凸包快速求取算法[J]. 数字技术与应用 2014(03)
    • [26].基于凸包的模糊支持向量机[J]. 福建电脑 2018(04)
    • [27].基于改进凸包算法的船舶巡航预警快速监测研究[J]. 计算机应用研究 2018(11)
    • [28].冷轧钢卷凸包缺陷治理[J]. 江西建材 2015(14)
    • [29].精密接插件凸包成形的数值模拟[J]. 科技创新导报 2012(35)
    • [30].基于凸包重心模型的群组运动模式分析方法[J]. 计算机应用研究 2015(03)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    模式识别中的样本选择研究及其应用
    下载Doc文档

    猜你喜欢