基于虚拟立体视约束的视角无关手语识别研究

基于虚拟立体视约束的视角无关手语识别研究

论文摘要

手语识别研究致力于通过计算机将手语翻译成文字或者语音,以方便聋人与健听人之间的交流和帮助聋人更好地融入社会。依手语数据获取方式的不同,手语识别研究通常分为基于数据手套的手语识别和基于视觉的手语识别两个类别。二者当中,基于视觉的手语识别研究,由于应用起来更为方便和自然,备受研究者所关注。然而,大多数基于视觉的手语识别研究限定摄像机的捕获视角,通常限定为正面视角。限定捕获视角意味着手语者只能在特定的空间以特定的朝向执行手语,这严重地限制着手语者的自由。本文针对单摄像机应用中、一定范围内视角无关的手语识别,也即观测手语样本的捕获视角在一定范围内任意且未知情况下的手语识别进行研究,以在一定程度上解除对摄像机捕获视角的限定,从而方便用户的使用。这里的一定范围,是指摄像机的光轴方向与手语者正面朝向之间的角度限制在45?范围之内。数据规模初步定于中等词汇集。重点研究如下两方面内容:一是基于视角相关特征的视角无关手语识别研究。基于虚拟立体视约束,即“同一手语不同捕获视角下的两个样本,对齐之后可解释为由某一虚拟的立体视觉系统同步捕获的一个样本对”,本文提出一种新颖的、使用视角相关特征的视角无关手语识别框架。此框架将两个手语序列的匹配问题转化为极几何中的一个验证问题,通过验证“两个手语序列是否能被解释为由某一虚拟立体视觉系统同步捕获的一个样本对”来完成识别。由于是直接基于特征点的图像坐标进行识别,此框架提供了一种使用视角相关特征而实现视角无关手语识别的可能性。基于此框架,本文提出了三种具体的使用视角相关特征的视角无关手语识别方法,分别是基于基础矩阵唯一性的视角无关手语识别方法、基于证据理论的验证基础矩阵唯一性的视角无关手语识别方法以及基于复合帧对应的视角无关手语识别方法。实验显示了这些方法的有效性。二是短时数据缺失下稳定而有效的视角无关手语识别方法研究。所谓数据缺失,是指手语样本中某些时刻只能提供很少的有用特征以供匹配之用或者不能提供任何有用特征的情况。很多因素都能导致数据缺失的出现,比如自遮挡、成像因素导致的图像模糊、以及特征提取算法的不完善等因素。除此之外,在视角无关的手语识别中,同一手语不同捕获视角的样本之间可视特征的不尽一致,也能够导致数据缺失的出现。数据缺失影响识别算法的有效性和可行性。本文针对短时数据缺失下稳定而有效的视角无关手语识别方法进行重点研究,提出了基于运动元顺序出现单应性的视角无关手语识别方法以及基于基础矩阵的局部采样(Sample)加全局验证(Consensus)的视角无关手语识别方法。这两种方法基于多帧图像来进行序列匹配的考察,由于多帧图像可以提供更多的有用特征,这两种方法能够有效地处理短时数据缺失情况。实验显示了这两种方法的有效性。值得指出的是,本文提出的基于虚拟立体视约束的视角无关识别框架和因之而提出的各种视角无关识别方法不仅仅适用于手语识别,还能应用到更为广泛的领域,比如视角无关的动作识别和刚体运动分析等。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 手语识别
  • 1.3 手语识别的研究意义与典型应用
  • 1.4 本文研究内容和主要贡献
  • 1.4.1 本文研究内容
  • 1.4.2 主要贡献
  • 1.5 论文的组织结构
  • 第2章 手语识别研究综述
  • 2.1 手语识别研究现状
  • 2.1.1 手语数据获取
  • 2.1.2 手语特征提取
  • 2.1.3 手语识别
  • 2.2 手语识别的国内研究状况
  • 2.3 手语识别方法归类
  • 2.3.1 模板匹配方法
  • 2.3.2 人工神经网络方法
  • 2.3.3 HMM 方法
  • 2.3.4 神经网络和HMM 相结合的方法
  • 2.3.5 其他识别方法
  • 2.3.6 语言模型
  • 2.4 若干开放问题
  • 2.5 本章小结
  • 第3章 基于视角相关特征的视角无关手语识别
  • 3.1 问题的提出
  • 3.2 相关工作
  • 3.2.1 视角无关的手语识别研究
  • 3.2.2 极几何
  • 3.2.3 极几何在视角无关的活动分析中的应用
  • 3.3 基于虚拟立体视约束的视角无关手语识别框架
  • 3.3.1 识别框架
  • 3.3.2 视角无关的手语序列对齐
  • 3.4 基于基础矩阵唯一性的视角无关手语识别方法
  • 3.5 基于证据理论的验证基础矩阵唯一性的视角无关手语识别方法
  • 3.6 基于复合帧对应的的视角无关手语识别方法
  • 3.7 实验与分析
  • 3.7.1 数据介绍
  • 3.7.2 HMM 方法的实验结果
  • 3.7.3 使用第九维奇异值的实验结果
  • 3.7.4 提出的三种视角无关手语识别方法的实验结果
  • 3.7.5 进一步分析
  • 3.8 本章小结
  • 第4章 短时数据缺失下的视角无关手语识别方法
  • 4.1 问题的提出
  • 4.2 基于运动元顺序出现单应性的视角无关手语识别方法
  • 4.2.1 测量单应性
  • 4.2.2 识别
  • 4.3 基于基础矩阵的局部采样(Sample)加全局验证(Consensus)的视角无关手语识别方法
  • 4.3.1 基本框架
  • 4.3.2 Sample-Consensus 方法
  • 4.3.3 识别
  • 4.4 实验与分析
  • 4.4.1 数据介绍
  • 4.4.2 单应性识别方法的实验结果
  • 4.4.3 Sample-Consensus 识别方法的实验结果
  • 4.4.4 进一步分析
  • 4.5 本章小结
  • 第5章 系统实现相关
  • 5.1 基本框架
  • 5.2 关键技术
  • 5.2.1 颜色手套的设计
  • 5.2.2 特征点提取算法
  • 5.3 相关测试
  • 5.3.1 亮片型颜色手套测试
  • 5.3.2 拐点颜色手套I 测试
  • 5.3.3 拐点颜色手套II 测试
  • 5.3.4 四种颜色手套比较
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 附录 A 标定数据集词汇集
  • 附录 B 全自动数据集词汇集
  • 攻读博士学位期间发表的学术论文
  • 致谢
  • 个人简历
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于虚拟立体视约束的视角无关手语识别研究
    下载Doc文档

    猜你喜欢