基于多特征融合与特征包的手势检测识别算法研究

论文摘要

随着现代社会的发展,人机交互技术越来越受到人们的追捧。基于视觉的手势识别因其自然直观的交互方式也越来越受推崇,是近几年的研究热点。手势是一种自然而直观的人际交流模式,手势识别直接以人手作为输入,但由于人手的高自由度,同一手势由于旋转、仿射和用户的不同等因素会呈现较大的差异,另外复杂背景环境的干扰也是一个重大的挑战,光线的变化,与肤色相似物体的干扰等都会对手势检测和识别的结果有很大的影响。针对基于视觉的手势识别中,手势的检测与识别易受背景、环境光照等影响,本文对手势的特征描述方法、手势的检测和识别方法进行深入研究。具体研究工作包括以下几个方面：（1）首先对常用的手势特征描述方法进行深入理论分析,并参考了人脸识别、目标检测等领域常见的特征检测与描述方法,研究其在手势检测与识别中的可行性,并比较了各个特征的特点及不足。（2）在手势检测方面,针对复杂背景下单特征手势检测鲁棒性差、误检率高的缺点,提出了基于级联框架下的多特征融合手势检测算法。该算法单独训练LBP（Local Binary Pattern）特征手势检测器和Haar特征手势检测器,并按LBP检测器和Haar检测器的顺序级联整合成鲁棒的多特征手势检测器,相比单一特征误检率大大降低,并且修改了传统的级联AdaBoost,只有被两级分类器都判定为负样本的样本才被排除,提高了算法的检测率。实验结果表明该算法能够有效提高复杂背景下手势检测的鲁棒性,而且完全满足手势检测的实时性要求。（3）在手势识别方面,手势的识别效果易受手势旋转、光照亮度的影响,针对该问题,借鉴目标识别和图像检索领域的特征包（Bag of Features）算法,提出了基于特征包的手势识别算法。该算法首先通过SURF （Speed-up Robust Features）提取手势图像的特征描述符,使手势对尺度、旋转、光照具有很强的适应力,再应用特征包算法把SURF特征描述符映射到一个统一维度的向量,即Bag of Features特征向量,最后再用支持向量机对图像得到的特征向量进行训练分类。实验结果表明,提出的算法不仅具有较高的时间效率,满足手势识别的实时性,而且即使在大角度的旋转以及亮度的变化下,仍能达到较高的识别率。

论文目录

中文摘要

ABSTRACT

第一章绪论

1.1 课题研究背景及意义

1.2 手势识别的研究内容

1.3 基于视觉的手势识别

1.3.1 手势建模

1.3.2 手势检测

1.3.3 手势的跟踪定位

1.3.4 手势的分类识别

1.4 手势检测与识别的问题与难点

1.5 本文主要工作

1.6 论文结构

第二章手势特征提取

2.1 引言

2.2 Haar特征

2.3 LBP特征

2.4 SURF

2.4.1 SURF特征检测

2.4.2 SURF特征描述符

2.5 本章小结

第三章基于级联AdaBoost的多特征融合手势检测

3.1 引言

3.2 特征选择

3.3 AdaBoost算法

3.4 级联AdaBoost算法

3.5 基于级联AdaBoost的多特征融合

3.6 实验与分析

3.7 本章小结

第四章基于特征包的手势识别

4.1 引言

4.2 基于特征包的手势识别算法框架

4.3 手势特征描述符提取

4.4 视觉词汇表生成与手势图像的BoF表示

4.5 分类器设计

4.6 算法步骤

4.7 实验与分析

4.8 本章小结

总结与展望

参考文献

致谢

在学期间的研究成果及发表的学术论文

基于多特征融合与特征包的手势检测识别算法研究

论文摘要

论文目录

相关论文文献

猜你喜欢