论文摘要
随着现代社会的发展,人机交互技术越来越受到人们的追捧。基于视觉的手势识别因其自然直观的交互方式也越来越受推崇,是近几年的研究热点。手势是一种自然而直观的人际交流模式,手势识别直接以人手作为输入,但由于人手的高自由度,同一手势由于旋转、仿射和用户的不同等因素会呈现较大的差异,另外复杂背景环境的干扰也是一个重大的挑战,光线的变化,与肤色相似物体的干扰等都会对手势检测和识别的结果有很大的影响。针对基于视觉的手势识别中,手势的检测与识别易受背景、环境光照等影响,本文对手势的特征描述方法、手势的检测和识别方法进行深入研究。具体研究工作包括以下几个方面:(1)首先对常用的手势特征描述方法进行深入理论分析,并参考了人脸识别、目标检测等领域常见的特征检测与描述方法,研究其在手势检测与识别中的可行性,并比较了各个特征的特点及不足。(2)在手势检测方面,针对复杂背景下单特征手势检测鲁棒性差、误检率高的缺点,提出了基于级联框架下的多特征融合手势检测算法。该算法单独训练LBP(Local Binary Pattern)特征手势检测器和Haar特征手势检测器,并按LBP检测器和Haar检测器的顺序级联整合成鲁棒的多特征手势检测器,相比单一特征误检率大大降低,并且修改了传统的级联AdaBoost,只有被两级分类器都判定为负样本的样本才被排除,提高了算法的检测率。实验结果表明该算法能够有效提高复杂背景下手势检测的鲁棒性,而且完全满足手势检测的实时性要求。(3)在手势识别方面,手势的识别效果易受手势旋转、光照亮度的影响,针对该问题,借鉴目标识别和图像检索领域的特征包(Bag of Features)算法,提出了基于特征包的手势识别算法。该算法首先通过SURF (Speed-up Robust Features)提取手势图像的特征描述符,使手势对尺度、旋转、光照具有很强的适应力,再应用特征包算法把SURF特征描述符映射到一个统一维度的向量,即Bag of Features特征向量,最后再用支持向量机对图像得到的特征向量进行训练分类。实验结果表明,提出的算法不仅具有较高的时间效率,满足手势识别的实时性,而且即使在大角度的旋转以及亮度的变化下,仍能达到较高的识别率。