特征选择算法研究

特征选择算法研究

论文摘要

特征选择是目标识别技术的关键技术环节之一。特征选择按照和后续分类算法的结合方式可分为嵌入式、过滤式和封装式。本文主要研究过滤式和封装式特征选择算法。本文首先引用了M. Dash和H. Liu提出的特征选择框架,这个框架指出一个特征选择算法是由“特征子集生成”、“特征子集评价”、“停止条件”和“结果验证”四个部分组成的。基于这个框架,本文总结归纳了常用特征选择算法的搜索策略和评价准则。过滤式(Filter)特征选择算法的评价准则与分类器无关,论文研究了两种过滤式算法。第一种过滤式算法是ReliefF算法与一种基于特征相关性算法的组合式算法。ReliefF算法产生的特征有效性强,但可能存在冗余性;Mitra提出了一种基于最大信息压缩指标的算法,这种算法能很好的去除冗余特征,但也可能选择无效特征。依据两种算法的优缺点将二者组合在一起使用,组合算法产生的特征子集都是有效特征,而且不存在冗余特征。第二种过滤式算法是改进的HFR算法:针对HFR算法用于评估待选特征重要性的特征频数(CR值)与构造简单差异矩阵的参数有关这一不足,论文提出用特征的属性重要性度量(SGF值)代替CR值来度量待选特征重要性,改进了HFR算法。封装式(Wrapper)特征选择算法是评价准则与分类器有关的方法。本文提出了两种封装式算法。一种是基于分类结果矩阵的特征选择算法:首先受粗糙集相对差异比较表的启发,提出分类结果矩阵的概念,并将粗糙集中构造最小差异表(MDL)的思想应用到选择特征子集的过程中,实验验证这种算法性能良好,选出的特征子集不仅提高了分类器的速度,而且保证了分类精度。另一种算法是基于互补系数的特征选择算法:本文从特征对样本的分类效果的角度来度量特征之间的相关性,并提出互补系数的概念,然后在权值较大的待选特征中选择与已选特征互补系数大的特征。实验验证这种算法能够很好去除无效特征和冗余特征,并且与传统的封装式算法相比大大降低了时间复杂度。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 特征选择的定义
  • 1.3 特征选择研究的历史与现状
  • 1.4 本文内容安排
  • 第二章 特征选择各要素分析
  • 2.1 特征子集生成
  • 2.2 特征子集评价
  • 2.3 停止条件
  • 2.4 结果验证
  • 2.5 本章小结
  • 第三章 过滤式特征选择算法
  • 3.1 ReliefF 与一种基于特征相关性算法的组合算法
  • 3.1.1 ReliefF 特征选择算法
  • 3.1.2 一种基于特征相关性的特征选择算法
  • 3.1.3 ReliefF 算法与Mitra 算法的组合算法
  • 3.1.4 组合算法实验验证
  • 3.2 改进的HFR 算法
  • 3.2.1 粗糙集理论简述
  • 3.2.2 AR1 属性约简算法
  • 3.2.3 HFR(Hybrid Fast Reduction)算法
  • 3.2.4 HFR 的改进算法
  • 3.3 本章小结
  • 第四章 封装式特征选择算法
  • 4.1 基于分类结果矩阵的特征选择算法
  • 4.1.1 分类结果矩阵
  • 4.1.2 基于分类结果矩阵的特征选择算法
  • 4.1.3 实验验证
  • 4.2 基于互补系数的特征选择算法
  • 4.2.1 互补系数
  • 4.2.2 基于互补系数的特征选择算法
  • 4.2.3 实验验证及结果分析
  • 4.3 本章小结
  • 第五章 结束语
  • 致谢
  • 作者在攻读硕士学位期间发表的论文
  • 参考文献
  • 相关论文文献

    • [1].基于指数损失间隔的多标记特征选择算法[J]. 计算机技术与发展 2020(04)
    • [2].基于?_(2,1)范数的在线流特征选择算法[J]. 计算机与数字工程 2019(06)
    • [3].森林优化特征选择算法的增强与扩展[J]. 软件学报 2020(05)
    • [4].基于自步学习的半监督特征选择算法研究[J]. 电脑知识与技术 2020(15)
    • [5].基于图的特征选择算法综述[J]. 安徽大学学报(自然科学版) 2017(01)
    • [6].面向高维微阵列数据的集成特征选择算法[J]. 计算机工程与科学 2016(07)
    • [7].基于支持向量机的特征选择算法综述[J]. 信息工程大学学报 2014(01)
    • [8].一种改进的文本分类特征选择算法[J]. 微电子学与计算机 2011(12)
    • [9].基于邻域交互增益信息的多标记流特征选择算法[J]. 南京大学学报(自然科学) 2020(01)
    • [10].大数据中基于稀疏投影的在线特征选择算法[J]. 湖南科技大学学报(自然科学版) 2018(03)
    • [11].一种改进的动态流特征选择算法[J]. 计算机工程与应用 2012(18)
    • [12].特征选择算法研究综述[J]. 安徽广播电视大学学报 2019(04)
    • [13].一种改进的类别区分词特征选择算法[J]. 计算机与现代化 2019(03)
    • [14].特征选择算法及应用综述[J]. 办公自动化 2018(21)
    • [15].多标记特征选择算法的综述[J]. 郑州大学学报(理学版) 2020(04)
    • [16].海量高维数据下分布式特征选择算法的研究与应用[J]. 科技通报 2013(08)
    • [17].全局调距和声特征选择算法[J]. 计算机工程与应用 2019(02)
    • [18].基于标记权重的多标记特征选择算法[J]. 计算机科学 2017(10)
    • [19].多标记不完备数据的特征选择算法[J]. 计算机科学与探索 2019(10)
    • [20].一种基于支持向量数据描述的特征选择算法[J]. 智能系统学报 2015(02)
    • [21].基于XGBoost的特征选择算法[J]. 通信学报 2019(10)
    • [22].用于轴承表面缺陷分类的特征选择算法[J]. 轴承 2018(01)
    • [23].基于森林优化特征选择算法的改进研究[J]. 软件学报 2018(09)
    • [24].面向代价敏感的多标记不完备数据特征选择算法[J]. 小型微型计算机系统 2018(12)
    • [25].基于多视角学习和注意力的特征选择算法[J]. 北京交通大学学报 2020(05)
    • [26].一种基于谱理论的并行特征选择算法[J]. 计算机应用与软件 2010(11)
    • [27].改进的特征选择算法[J]. 计算机工程与设计 2008(22)
    • [28].基于分割策略的特征选择算法[J]. 计算机科学 2018(10)
    • [29].基于拉普拉斯评分的多标记特征选择算法[J]. 计算机应用 2018(11)
    • [30].基于特征关联的多标记谱特征选择算法[J]. 闽南师范大学学报(自然科学版) 2017(02)

    标签:;  ;  ;  ;  ;  ;  

    特征选择算法研究
    下载Doc文档

    猜你喜欢