基于单视觉通道唇读系统的研究

基于单视觉通道唇读系统的研究

论文摘要

唇读(lipreading/ speechreading)是人工智能,图像处理,模式识别等相关研究领域综合发展所产生的一个新的研究方向,被广泛的应用于噪声环境下提高自动语音的识别率,也用于安防系统的身份认证,远距离语义识别,听觉障碍人士的语言学习,老年人的唇部语义学习及残障人士辅助系统的唇部命令识别等。目前关于唇读的研究集中在将视频通道作为音频通道的一种补充来提高语音的识别率。在真正的高噪声环境下,语音信道的信息量急剧下降,系统的识别率主要取决于视觉通道,研究基于单视觉通道的语义识别就非常重要。目前基于单视觉通道唇读的研究处于较为初级的阶段,研究对象为小词汇量,且识别率相对较低。将词汇量扩大到较大词汇量,提高单视觉通道唇读的识别率是本文的研究目标。本文针对单视觉唇读系统中几个关键问题,进行了较为系统,深入及广泛的研究,主要的研究工作及成果包括以下几个方面:(1)对国内外的数据库进行了相应的研究,结合本文的研究对象采用哈工大的数据库HITBICAVDatabase作为主库,在该库的基础上选取不同音标的字建立了一个适合本文研究的数据子库database9603。并对该数据库中的每幅图像提取感兴趣区域生成了可直接用于特征提取和识别的数据库。自建了一个小型的双模态唇读数据库,并对自建数据库进行相应的预处理工作。(2)针对唇部感兴趣区域的提取问题,提出了基于人脸结构和灰度信息的感兴趣区域提取方法。该方法通过对大量人脸结构的分析发现,人嘴的宽度与双眼的距离相当,因此采用双眼瞳孔来定位唇部的左右边界,并完成对唇部图像的缩放以及水平位置的调整。利用灰度投影检测唇角,定位唇部的垂直位置。该方法提取的图像具有相对固定的参照,能够真实反映唇部的大小和形状信息。对镜头的缩放以及头部的倾斜具有较好的鲁棒性。针对唇部的提取问题,提出了基于LAB空间a分量的唇部提取(分割)方法。通过对色度空间各分量可分离性的研究,通过fisher准则寻找到能够将唇部和非唇部(肤色,牙齿,胡须等)进行有效分割的彩色分量‘a’。该方法可较好的将唇部提取出来,并根据图像特征自动生成阈值,便于唇部提取的自动化。针对基于轮廓的唇部提取,本文提出了基于流形的唇部轮廓提取方法。实验结果表明,本文提出的唇部轮廓提取方法更逼近唇部的真实轮廓图像。文中还将‘a’分量方法与流形的方法结合起来,提取唇部,实验结果表明基于色度和轮廓的方法提取的唇部效果更好。(3)对唇部特征表示进行研究。提出了DT-CWT+PCA的唇部特征提取方法,DT-CWT具有近似的平移不变性及良好的方向性,能够较好的提取唇部感兴趣区域的边缘信息及频域信息,且能克服感兴趣区域(ROI)提取过程中存在的位移问题。实验结果表明该特征提取方法提高了识别率。针对DT-CWT+PCA的方法中将DT-CWT的幅值系数重新排列导致丧失数据本身几何信息的缺点,提出了基于DT-CWT+LBP+PCA空频域相结合的特征提取方法。该方法提取的特征既能体现唇部的频域信息和空间域信息,又能反应其局部信息和全局信息,且对位移和旋转具有不变性。实验结果表明基于DT-CWT和LBP的空频域特征提取方法很大程度上提高了唇读的识别率。(4)对唇部特征有效降维问题进行研究。提出了基于DCT+ONPP的特征提取方法,正交邻域保持投影(ONPP)在降维的同时保持了数据本身的几何结构信息。实验结果表明该方法能够提高识别率。在基于监督的学习方法,本文提出了采用局部敏感的判别分析方法(LSDA)对唇部图像提取特征。LSDA结合了LDA和LPP两者的优点,充分体现了唇部局部几何特征。实验结果表明与LDA及传统的方法相比,本文方法识别率更高,且该方法的识别率高于非监督的降维方法。(5)针对唇读系统中各样本帧数不同的问题,提出了基于唇部灰度能量图的概念,并结合唇部能量图提出相应的特征提取方法。唇部灰度能量图是通过唇部灰度图像的叠加平均得到的,在投影的过程中完成了样本特征维数的归一化。唇部灰度能量图在保留唇部图像本身静态特征的同时也反映了其动态特征,有效去除传统方法中对单帧分别提取特征时各帧特征之间的相关性,大大降低了特征的维数,缩短了识别时间,提高了识别率。唇部灰度能量图的提出,使得基于人脸识别和基于监督的特征提取方法非常容易移植到基于唇部灰度能量图的唇部特征提取上来。基于此本文将DT-CWT+LBP和LDA的特征表示和特征降维方法应用到唇部灰度能量图上来提取特征。实验结果表明传统的特征表示和特征降维方法仍然适用于唇部灰度能量图,且基于能量图的方法比传统方法的识别率高。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景与意义
  • 1.2 唇读主要研究内容
  • 1.2.1 数据库
  • 1.2.2 唇部的检测定位与分割
  • 1.2.3 唇部特征提取
  • 1.2.4 识别方法
  • 1.3 唇读的研究现状
  • 1.3.1 国外研究现状
  • 1.3.2 国内研究现状
  • 1.4 本文的研究内容与创新点
  • 1.5 论文的内容安排
  • 第二章 唇读数据库
  • 2.1 引言
  • 2.2 国外相关的数据库
  • 2.3 国内主要的双模态数据库介绍
  • 2.4 本文所使用的数据库
  • 2.4.1 采用现有的数据库
  • 2.4.2 自建数据库
  • 2.5 本章小结
  • 第三章 唇部的检测定位与分割
  • 3.1 引言
  • 3.2 唇部感兴趣区域的定位和分割方法
  • 3.2.1 典型方法介绍
  • 3.2.2 基于人脸结构和中心扩展的感兴趣区域分割
  • 3.3 基于色度的唇部提取方法
  • 3.3.1 相关方法介绍
  • 3.3.2 基于LAB 空间a 分量的唇部提取方法
  • 3.4 基于轮廓的唇部提取方法
  • 3.4.1 主动轮廓模型方法
  • 3.4.2 可变模板法
  • 3.4.3 流形用于轮廓提取的理论基础
  • 3.4.4 基于流形的轮廓提取方法基本思路
  • 3.4.5 实验及其结果
  • 3.5 基于LAB 色度空间和流形的唇部提取方法(LABME)
  • 3.5.1 参数设置
  • 3.5.2 实验步骤
  • 3.5.3 实验结果及其分析
  • 3.6 本章小结
  • 第四章 唇部特征提取
  • 4.1 引言
  • 4.2 唇部特征提取方法简介
  • 4.2.1 特征唇方法
  • 4.2.2 基于DCT 变换的唇部特征提取
  • 4.2.3 基于DCT+PCA 的唇部特征提取
  • 4.2.4 基于DCT+LDA 的唇部特征提取
  • 4.3 DCT +ONPP 的唇部特征提取方法
  • 4.3.1 流形降维相关方法介绍
  • 4.3.2 ONPP 简介
  • 4.3.3 基于DCT 与ONPP 的唇部特征提取方法
  • 4.3.4 实验及其结果
  • 4.4 DCT+LSDA
  • 4.4.1 LSDA 简介
  • 4.4.2 基于LSDA 的唇部特征提取方法
  • 4.5 基于DT-CWT+PCA 的特征提取方法
  • 4.5.1 双树复小波简介
  • 4.5.2 DT-CWT+PCA 方法思路
  • 4.5.3 实验及其结果
  • 4.6 DT-CWT+LBP+PCA
  • 4.6.1 局部二值模式简介
  • 4.6.2 思路及步骤
  • 4.6.3 识别方法
  • 4.6.4 实验结果及其分析
  • 4.7 DT-CWT+ONPP 的特征提取方法
  • 4.8 本章小结
  • 第五章 基于唇部灰度能量图的特征提取
  • 5.1 引言
  • 5.2 能量图相关的理论
  • 5.2.1 步态能量图GEI
  • 5.2.2 运动历史图像(Motion History Image, MHI)和运动能量图MEI
  • 5.2.3 联合时空图
  • 5.2.4 时空能量图(Spactio-temporal energy,STE)
  • 5.3 唇部灰度能量图
  • 5.3.1 唇部灰度能量图(Lip Gray Energy Image,LGEI)
  • 5.3.2 数据的预处理
  • 5.3.3 LGEI 的抗噪性
  • 5.3.4 唇部灰度能量图用于唇读
  • 5.4 唇部灰度能量图的扩展
  • 5.5 基于唇部灰度能量图和DCT+PCA 的唇部特征提取方法
  • 5.5.1 LGEI+DCT+PCA 的基本思路
  • 5.5.2 实验及其结果分析
  • 5.6 基于唇部灰度能量图的其它特征提取方法
  • 5.6.1 LGEI+DCT+LDA
  • 5.6.2 LGEI+DT-CWT+LBP
  • 5.7 本章小结
  • 结论
  • 1. 总结
  • 2. 未来工作展望
  • 参考文献
  • 攻读博士学位期间完成的学术论文
  • 致谢
  • 附件
  • 相关论文文献

    • [1].如何有效护理唇部 这些细节让你冬天不再干燥起皮[J]. 家庭生活指南 2018(11)
    • [2].水润 饱满 亮泽 完美唇部养成记[J]. 医学美学美容 2019(Z1)
    • [3].懒人的护唇秘籍[J]. 37°女人 2017(01)
    • [4].美丽问答[J]. 健康之家 2017(02)
    • [5].口红如何显色更持久[J]. 伴侣 2017(09)
    • [6].六款唇部护理品 让双唇水润饱满[J]. 求医问药(女人健康) 2010(02)
    • [7].新品推荐[J]. 时尚北京 2015(12)
    • [8].冬季注意唇部保养[J]. 时尚北京 2014(01)
    • [9].唇部较大粘液腺囊肿摘除手术的体会[J]. 四川医学 2011(08)
    • [10].脉冲Nd:YAG激光照射唇部静脉湖温度场分布模型的建立和验证[J]. 中国激光医学杂志 2017(02)
    • [11].寒冷时节的唇部护理[J]. 人生与伴侣(下半月版) 2008(11)
    • [12].基于惩罚感知器的唇部定位方法[J]. 嘉应学院学报 2011(08)
    • [13].唇部软组织评价与正畸治疗相关性的研究进展[J]. 医学综述 2018(09)
    • [14].唇部压疮7例原因分析及对策[J]. 基层医学论坛 2013(06)
    • [15].巨大唇部动静脉畸形综合治疗9例临床报告[J]. 中国当代医药 2011(33)
    • [16].基于唇色信息的唇部检测方法研究[J]. 嘉应学院学报 2010(11)
    • [17].唇部巨大动静脉畸形五例临床报告[J]. 临床口腔医学杂志 2009(09)
    • [18].Glossy Lips 璀璨双唇[J]. 医学美学美容(Me) 2014(12)
    • [19].口服普萘洛尔治疗婴儿唇部血管瘤的临床观察[J]. 广州医药 2012(01)
    • [20].对唇部用品保湿性能的研究[J]. 中国洗涤用品工业 2011(05)
    • [21].一种有效的唇部特征定位算法[J]. 科技资讯 2015(23)
    • [22].通过图像分析、临床评估和消费者评估的方法评价唇部产品的性能[J]. 日用化学品科学 2015(08)
    • [23].打造完美唇形 轻松笑出美丽[J]. 医学美学美容(Me) 2017(05)
    • [24].71例恶性肿瘤术后唇部缺损修复的分析[J]. 实用口腔医学杂志 2013(05)
    • [25].诱人美唇 轻松塑造[J]. 城色(风尚) 2011(05)
    • [26].玩转魅惑双唇[J]. 医学美学美容(蜜·Me) 2011(06)
    • [27].安氏Ⅱ类Ⅰ分类错女性唇部软组织厚度与唇部回收的关系[J]. 口腔颌面修复学杂志 2020(03)
    • [28].自制茯苓归蜜膏可防治唇部干裂[J]. 蜜蜂杂志 2020(06)
    • [29].下唇部血管平滑肌瘤[J]. 临床皮肤科杂志 2015(12)
    • [30].一种快速鲁棒的唇部检测方法[J]. 中国制造业信息化 2009(09)

    标签:;  ;  ;  ;  ;  ;  ;  

    基于单视觉通道唇读系统的研究
    下载Doc文档

    猜你喜欢