论文摘要
随着计算机硬件及软件技术的迅速发展,使符合人际交流习惯的手势识别成为可能。由于基于视觉的手势识别技术涉及计算机视觉、图像处理、模式识别等领域,以及手势本身具有的多样性、多义性和时间空间上的差异性等特点,此方向的研究成为一个极富挑战性的多学科交叉研究课题。本文主要研究手势识别中的手势建模过程,包括手势分析和手势识别两个阶段。传统的基于隐马尔可夫模型(简称HMM)的手势识别算法的最终结果是由输出概率最大的HMM模型来决定的。然而由于手势识别轨迹中打手势人本身的动作幅度不大以及部分手势本身的相似性,若干个HMM模型的输出概率有可能非常接近。仅凭概率最大来做判断,存在误识别的可能。同时,基于支持向量机(简称SVM)的手势识别是利用手势轨迹的整体数值特征来进行识别,从而忽视了手势轨迹中间的各种变化。HMM模型利用上下文关系进行模式识别,更多地表达了类别内的相似性,而支持向量机擅长分类问题,更大程度上反映了类别间的差异,二者的融合恰好弥补了彼此的不足。鉴于隐马尔可夫模型(简称HMM)具有良好的时间序列建模能力和支持向量机(SVM)在有限样本的分类方面具有的优良性能,本文提出了一种基于轨迹分割的HMM_SVM融合手势识别模型。其基本思想是:将手势特征提取过程中得到的手势轨迹分割成两部分,分别放入已经训练好的16个HMM模型中计算最大似然概率。如果输出概率满足特定条件,则借助SVM再次分类。这样能够较准确的进行手势识别,在一定程度上提高手势识别准确率。本文还实现了实时手势识别的原型系统。该系统包含手势图像捕获、手势图像预处理、手势分割、手势特征提取、手势轨迹识别等过程。在手势图像预处理阶段,本文提出一种基于改进ILAE算法的图像局部自适应增强算法对捕获的手势图像进行增强,为后续的手势图像分割及手势特征提取奠定了很好的基础。本文的手势识别实验结果表明,单独运用HMM模型对8种有代表性的手势轨迹的平均识别率为93.25%。而运用本文提出的一种基于轨迹分割的HMM_SVM融合手势识别模型对该8种有代表性的手势轨迹的平均识别率达到95%。后者在一定程度上提高了手势识别效率。最后,本文给出了目前所做的工作的一些不足之处以及对后续工作的展望。