论文题目: 特征选择算法及其在基于内容图像检索中的应用研究
论文类型: 博士论文
论文专业: 计算机软件与理论
作者: 李云
导师: 吴中福,刘嘉敏
关键词: 特征选择算法,模糊集,支持向量机,基于内容的图像检索
文献来源: 重庆大学
发表年度: 2005
论文摘要: 随着计算机应用范围和领域的日益扩大,特别是Internet 的飞速发展,在各种应用系统和Internet 上积累了大量、甚至海量数据,产生了“数据爆炸、知识贫乏”的现象;数据挖掘是解决这种问题的最为有效的手段,但是要有效地利用数据挖掘,对数据进行预处理是必不可少的,而特征选择是数据预处理中一种重要而且经常采用的方法。此外,在机器学习和模式识别中,特征选择也是一个必要的步骤。特征选择的研究开始于上个世纪的六十年代,已经有几十年的历史,取得了许多成果,但随着新的应用领域和新对象不断涌现,使得特征选择还有许多问题亟待解决。本论文对此作了详细介绍,并对目前特征选择的研究热点和问题进行了深入的研究,取得了一定的成果。作者把特征选择的研究分为三个阶段,首先介绍了常规的特征选择算法模型,并分别从研究人员和用户角度,对特征选择算法进行分类,这将大大方便用户选择合适的特征选择算法,有助于特征选择算法的应用,也为特征选择算法的进一步研究打下坚实的基础。其次,提出或者介绍了一些具体的特征选择算法,也是当前的一些研究重点和热点,包括在模糊特征空间进行特征选择的算法、监督的高维特征选择算法、非监督的高维特征选择算法和小样本训练的特征选择算法。其中,对于模糊特征空间的特征选择,主要是利用扩张矩阵作为搜索策略,类间的模糊相似性作为评价准则,理论和实验都表明该算法具有较好的性能和低的时间开销。该算法属于一种专业算法,充分考虑特征的模糊性,可以应用到模糊分类器的设计中。而在监督的高维特征选择中,由于现实的高维数据集中往往存在大量的冗余特征和不相关特征,因此作者提出了一种基于特征关联性的分层过滤器方法,有效地消除冗余特征和不相关特征,实验表明该算法能有效地降低特征维数。同时将该方法与部分基于关联性的方法进行了比较分析,并全面系统地回顾了所有基于特征关联性的高维特征选择算法以及关联性的定义和计算公式,大大有助于以后的研究。在非监督特征选择的研究中,作者提出一种新的基于特征排序和分层的过滤器算法,排序规则采用的是指数熵,而评价准则采用了模糊特征评价指标,该算法克服了其它一些非监督特征选择算法的缺点,可以同时剔除冗余特征和不相关特征,能有效处理高维数据和噪声数据,且计算的开销较小。前面提出的三种算法都是建立在训练样本较充分的基础之上,但当可获取的训练样本相对于特征维数偏少时,如何有效地进行特征选择?作者详细介绍了一类基于支持向量机的特征选择
论文目录:
中文摘要
英文摘要
1 绪论
1.1 课题的意义
1.2 国内外研究现状简介
1.3 存在的问题和不足
1.4 论文的主要研究内容和创新点
1.5 论文的组织结构
2 特征选择算法的特性研究
2.1 特征选择算法的结构
2.2 特征选择算法的伪代码
2.3 特征选择算法的分类
2.4 特征选择算法的选用
2.5 部分典型特征选择算法的流程与分析
2.6 本章小结
3 模糊特征选择算法
3.1 模糊特征选择的由来
3.2 特征模糊化
3.3 特征子集选择问题
3.3.1 问题分析
3.3.2 模糊扩张矩阵
3.4 算法设计
3.5 时间复杂性分析
3.6 实验
3.7 本章小结
4 基于关联性的监督高维特征选择算法研究
4.1 问题分析
4.2 特征关联性定义
4.3 特征关联性常用计算公式
4.4 基于关联性的特征选择算法分类
4.4.1 特征关联性作为评价准则
4.4.2 直接利用特征关联性
4.5 算法设计
4.5.1 ReliefF
4.5.2 Mitra’s 算法
4.5.3 算法结构分析
4.6 实验结果
4.7 本章小结
5 非监督高维特征选择算法
5.1 问题分析和已有的工作
5.2 特征排序
5.2.1 排序指标
5.2.2 排序算法
5.3 特征选择
5.3.1 特征子集评价准则
5.3.2 特征选择算法
5.3.3 冗余特征的处理
5.4 实验
5.4.1 数据集
5.4.2 排序和选择性能
5.5 本章小结
6 基于支持向量机的特征选择算法分析研究
6.1 支持向量机SVM 简介
6.2 基于SVM 的特征选择算法分类
6.2.1 直接利用分类函数
6.2.2 利用性能估计公式
6.2.3 核的主分量分析KPCA
6.3 未来研究方向
6.4 本章小结
7 基于内容图像检索的特征选择方法初探
7.1 图像检索的概述
7.2 CBIR 中特征选择的必要性
7.3 CBIR 中特征选择的方法
7.3.1 特征提取
7.3.2 相关反馈技术
7.3.3 常规特征选择方法
7.3.4 方法组合
7.4 应用实验
7.5 本章小结
8 总结
致谢
参考文献
附录 A 模糊集相似性度量
A.1 Metric-based 方法
A.2 集理论方法
A.3 贴近度方法
A.4 其它方法
附录 B PCA、SVD
B.1 主分量分析PCA
B.2 奇异值分解SVD
附录 C 攻读博士学位期间发表论文及参加科研情况
1、论文发表情况
2、参加科研情况
独创性声明
学位论文版权使用授权书
发布时间: 2005-11-07
参考文献
- [1].吸纳通路信息识别相关基因的特征选择算法的研究[D]. 田肃岩.吉林大学2018
- [2].面向高维小样本数据的分类特征选择算法研究[D]. 张靖.合肥工业大学2014
- [3].基于信息熵的特征选择算法研究[D]. 刘华文.吉林大学2010
- [4].网络空间图像标注中半监督稀疏特征选择算法研究[D]. 史彩娟.北京交通大学2015
- [5].文本分类中文本表示模型和特征选择算法研究[D]. 杨杰明.吉林大学2013
- [6].高通量数据特征选择算法研究[D]. 耿耀君.西安电子科技大学2013
- [7].粗糙拟阵及其在高维数据降维中的应用研究[D]. 王石平.电子科技大学2014
- [8].文本分类中特征选择技术的研究[D]. 王博.国防科学技术大学2009
- [9].面向动态不完备数据的特征选择模型与算法研究[D]. 舒文豪.北京交通大学2015
- [10].垃圾图像特征提取与选择研究[D]. 程红蓉.电子科技大学2011
标签:特征选择算法论文; 模糊集论文; 支持向量机论文; 基于内容的图像检索论文;