论文摘要
特征子集选取在机器学习,数据挖掘和模式识别领域起着很重要的作用。OFFSS (Optimal Fuzzy-valued Feature Subset Selection)是一种新的模糊值特征选取的方法,是基于两类事例集合的重叠程度来选取特征空间中最优特征子集。和其他特征子集选取方法如OFEI,FQI,MIFS 相比,OFFSS 虽然在训练,测试精度上没有明显的优势,但是却有相对较低的计算复杂度。由于OFFSS 中的重叠度是建立在某一个确定的相似性度量公式之上,所以不同的相似性度量公式会导致不同特征子集的产生。在三角隶属函数的基础上,对于相同的数据,本文讨论了不同相似性度量公式在OFFSS 的重叠度,所抽取的特征子集,抽取后的特征子集用于分类的准确性之间的关系。在此基础上,找到一个比较适合OFFSS 算法的相似性度量公式。
论文目录
第1章 绪论1.1 引言1.2 研究背景1.3 研究现状1.3.1 特征融合1.3.2 特征消减1.4 研究目标1.5 论文结构第2章 OFFSS 算法简介2.1 OFFSS 基本定义2.2 OFFSS 算法2.3 小结第3章 基于明可夫斯基距离相似性度量公式中参数 R 变化对 OFFSS 的影响3.1 三角形隶属函数3.2 引申定义和性质3.3 参数 R变化时抽取特征个数的变化3.4 小结第4章 OFFSS 算法中三类相似性度量公式间比较4.1 基于几何距离相似性度量公式A,B和 LA,B间数值关系是 SA,B≤LA,B'>4.1.1 SA,B和 LA,B间数值关系是 SA,B≤LA,BA,B和 WA,B之间数值关系是 SA,B≤WA,B'>4.1.2 SA,B和 WA,B之间数值关系是 SA,B≤WA,BA,B和 WA,B之间数值关系是 LA,B≤WA,B'>4.1.3 LA,B和 WA,B之间数值关系是 LA,B≤WA,B4.2 基于几何距离相似性度量公式和基于集合原理相似性度量公式间数值关系A,B和 LA,B间数值关系是 SetA,B≤LA,B'>4.2.1 SetA,B和 LA,B间数值关系是 SetA,B≤LA,BA,B和 SA,B的数值关系为 SetA,B≤SA,B'>4.2.2 SetA,B和 SA,B的数值关系为 SetA,B≤SA,BA,B和 WA,B的数值关系是 SetA,B≤ WA,B'>4.2.3 SetA,B和 WA,B的数值关系是 SetA,B≤ WA,BA,B 和基于集合相似性度量公式之间的数值关系不定'>4.3 MATCHINGA,B和基于集合相似性度量公式之间的数值关系不定A,B 和基于距离相似性度量公式之间的数值关系不定'>4.4 MATCHINGA,B和基于距离相似性度量公式之间的数值关系不定4.5 上述三类相似性度量公式间数值关系总结4.6 OV 噪声的处理4.7 三大类相似性度量公式对 OFFSS 算法结果影响的实验比较第5章 结论参考文献攻读硕士学位期间发表论文情况致谢
相关论文文献
标签:模糊集合论文; 三角隶属函数论文; 相似性度量论文; 重叠度论文; 模糊扩张矩阵论文; 特征抽取论文;