OFFSS算法中相似性度量公式的研究

OFFSS算法中相似性度量公式的研究

论文摘要

特征子集选取在机器学习,数据挖掘和模式识别领域起着很重要的作用。OFFSS (Optimal Fuzzy-valued Feature Subset Selection)是一种新的模糊值特征选取的方法,是基于两类事例集合的重叠程度来选取特征空间中最优特征子集。和其他特征子集选取方法如OFEI,FQI,MIFS 相比,OFFSS 虽然在训练,测试精度上没有明显的优势,但是却有相对较低的计算复杂度。由于OFFSS 中的重叠度是建立在某一个确定的相似性度量公式之上,所以不同的相似性度量公式会导致不同特征子集的产生。在三角隶属函数的基础上,对于相同的数据,本文讨论了不同相似性度量公式在OFFSS 的重叠度,所抽取的特征子集,抽取后的特征子集用于分类的准确性之间的关系。在此基础上,找到一个比较适合OFFSS 算法的相似性度量公式。

论文目录

  • 第1章 绪论
  • 1.1 引言
  • 1.2 研究背景
  • 1.3 研究现状
  • 1.3.1 特征融合
  • 1.3.2 特征消减
  • 1.4 研究目标
  • 1.5 论文结构
  • 第2章 OFFSS 算法简介
  • 2.1 OFFSS 基本定义
  • 2.2 OFFSS 算法
  • 2.3 小结
  • 第3章 基于明可夫斯基距离相似性度量公式中参数 R 变化对 OFFSS 的影响
  • 3.1 三角形隶属函数
  • 3.2 引申定义和性质
  • 3.3 参数 R变化时抽取特征个数的变化
  • 3.4 小结
  • 第4章 OFFSS 算法中三类相似性度量公式间比较
  • 4.1 基于几何距离相似性度量公式
  • A,B和 LA,B间数值关系是 SA,B≤LA,B'>4.1.1 SA,B和 LA,B间数值关系是 SA,B≤LA,B
  • A,B和 WA,B之间数值关系是 SA,B≤WA,B'>4.1.2 SA,B和 WA,B之间数值关系是 SA,B≤WA,B
  • A,B和 WA,B之间数值关系是 LA,B≤WA,B'>4.1.3 LA,B和 WA,B之间数值关系是 LA,B≤WA,B
  • 4.2 基于几何距离相似性度量公式和基于集合原理相似性度量公式间数值关系
  • A,B和 LA,B间数值关系是 SetA,B≤LA,B'>4.2.1 SetA,B和 LA,B间数值关系是 SetA,B≤LA,B
  • A,B和 SA,B的数值关系为 SetA,B≤SA,B'>4.2.2 SetA,B和 SA,B的数值关系为 SetA,B≤SA,B
  • A,B和 WA,B的数值关系是 SetA,B≤ WA,B'>4.2.3 SetA,B和 WA,B的数值关系是 SetA,B≤ WA,B
  • A,B 和基于集合相似性度量公式之间的数值关系不定'>4.3 MATCHINGA,B和基于集合相似性度量公式之间的数值关系不定
  • A,B 和基于距离相似性度量公式之间的数值关系不定'>4.4 MATCHINGA,B和基于距离相似性度量公式之间的数值关系不定
  • 4.5 上述三类相似性度量公式间数值关系总结
  • 4.6 OV 噪声的处理
  • 4.7 三大类相似性度量公式对 OFFSS 算法结果影响的实验比较
  • 第5章 结论
  • 参考文献
  • 攻读硕士学位期间发表论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    OFFSS算法中相似性度量公式的研究
    下载Doc文档

    猜你喜欢