数据降维技术的建模研究与应用 ——特征降维及其应用

数据降维技术的建模研究与应用 ——特征降维及其应用

论文摘要

特征降维是模式识别领域对高维数据分析的重要预处理步骤之一。在信息时代的科学研究中,不可避免的会遇到大量的高维数据,如人脸检测与识别、文本分类和微阵列数据基因选择等。在实际应用中,为了避免所谓的维数灾难问题,根据某些性质,将高维数据表示的观测点模拟成低维空间中的数据点,这一过程即为特征降维过程。总的来说,降维的目的是在保留数据的大部分内在信息的同时将高维空间的数据样本嵌入到一个相对低维的空间,而降维技术又可以分为“特征提取”和“特征选择”。经过适当的降维后,诸如可视化、分类等工作可以在低维空间中方便的实现。本文研究目的是为了探索新的有监督特征降维方法,并提出了一种基于支持向量机(SVM)的特征选择方法和一组基于有监督局部保留准则的特征降维算法。文中简要介绍了特征降维的准则,回顾了当前的主要特征降维技术,如主成分分析(PCA)、Fisher线性判别分析(FLDA)和最近的基于流形的特征提取方法以及相关的特征选择算法。本论文重点是:(一)建立了一种改进的基于支持向量机(SVM)的特征选择算法,阐述了应用该算法进行特征选择的原理和方法;(二)建立了有监督的局部保留准则,阐述了应用该准则进行特征提取与特征选择的原理和方法。针对基于支持向量机(SVM)的特征选择问题,文中充分利用SVM的最大间隔特性,利用支持向量和核函数来对特征进行排序和选择。而对于基于有监督的局部保留准则的特征降维,文中在详细分析无监督的局部保留准则利弊的基础上,提出了保留类内局部结构的同时最大化类内分离度的降维准则,并分别应用于特征提取和特征选择。论文最后采用MATLAB来编程实现了文中提出的算法,选取了大量的数据集来进行实验。大量的实验结果都表明,本文提出的方法是有效的、可行的,并且与现有的一些特征降维方法相比,更为有效。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 应用背景
  • 1.1.1 人脸检测与识别
  • 1.1.2 微阵列数据基因选择
  • 1.1.3 文本分类
  • 1.1.4 数据可视化
  • 1.2 研究现状
  • 1.3 研究意义与目标
  • 1.4 论文结构
  • 第二章 特征降维
  • 2.1 类别可分性判别
  • 2.2 特征提取
  • 2.2.1 主成分分析
  • 2.2.2 Fisher 线性判别分析
  • 2.2.3 基于流形的特征提取方法
  • 2.3 特征选择
  • 2.3.1 方差
  • 2.3.2 Fisher 分数
  • 第三章 基于支持向量机(SVM)的特征选择
  • 3.1 支持向量机简介
  • 3.2 改进的基于SVM 的特征选择算法
  • 3.2.1 输入空间的特征降维
  • 3.2.2 特征空间的特征降维
  • 3.2.3 输入空间与特征空间的联合
  • 3.3 实验结果
  • 3.3.1 输入空间实验
  • 3.3.2 特征空间实验
  • 3.3.3 输入和特征空间的联合实验
  • 3.4 小结
  • 第四章 基于有监督局部保留准则的特征降维
  • 4.1 局部保留准则及其在特征降维中的应用
  • 4.2 局部保留准则的优缺点分析
  • 4.3 有监督的局部保留准则及其在特征降维中的应用
  • 4.3.1 有监督的局部保留准则
  • 4.3.2 有监督的局部保留投影
  • 4.3.3 实验结果
  • 4.3.4 有监督的 Laplacian 分数
  • 4.3.5 实验结果
  • 4.4 小结
  • 第五章 总结与展望
  • 致谢
  • 参考文献
  • 附录:作者在攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].变量惩罚效应在贝叶斯分位数回归模型的应用[J]. 统计与决策 2016(19)
    • [2].基于遗传算法的无监督分形属性规约技术[J]. 计算机工程与应用 2008(10)
    • [3].两阶段无监督顺序前向分形属性规约算法[J]. 计算机研究与发展 2008(11)
    • [4].一种增强的局部保持投影方法[J]. 计算机工程与应用 2010(10)
    • [5].支持向量机和一类模糊推理系统的等效性及其应用[J]. 控制与决策 2009(09)
    • [6].一种基于KPCA与LDA的人脸识别改进算法[J]. 电子技术应用 2013(12)
    • [7].高维数据空间的性质及度量选择[J]. 计算机科学 2014(03)
    • [8].非线性支持向量机若干关键问题研究[J]. 计算机工程与科学 2010(05)
    • [9].基于联盟博弈的Filter特征选择算法[J]. 计算机工程 2013(04)
    • [10].基于二阶段法的新型凸壳支持向量机研究[J]. 现代交际 2012(11)
    • [11].改进近似动态规划法的攻击占位决策[J]. 火力与指挥控制 2019(07)
    • [12].高分子稀溶液的多尺度模型研究进展[J]. 厦门大学学报(自然科学版) 2013(02)
    • [13].基于仿真元模型的探索性分析方法研究[J]. 系统仿真学报 2011(07)
    • [14].基于概念格的文本聚类[J]. 计算机应用 2008(09)
    • [15].美式有分红看涨篮子期权解析近似定价模型[J]. 内江师范学院学报 2014(10)
    • [16].基于多维时间序列的灰色模糊信用评价研究[J]. 管理科学学报 2011(01)

    标签:;  ;  ;  ;  ;  ;  

    数据降维技术的建模研究与应用 ——特征降维及其应用
    下载Doc文档

    猜你喜欢