唇读的静动态特征表示方法研究

唇读的静动态特征表示方法研究

论文摘要

唇读(Lipreading)研究试图赋予计算机根据唇部运动辨别说话内容和根据唇部运动规律辨别人物身份的能力。该研究具有重要的科学意义和应用价值。从学科建设和发展的角度,唇读作为一个科学问题,是一个典型的图像模式分析、理解和分类计算的问题,涉及模式识别,计算机视觉,智能人机交互,认知科学等多个学科。同时,作为生物特征识别技术之一的基于唇读的说话人识别技术则在公共安全、信息安全等领域具有潜在的应用前景。目前,唇读在说话内容识别上还没有获得理想的识别性能,其中一个重要的原因就是没有对唇区特征区域给出很好的定义和有效的特征表示。本文重点探讨了特征表示的一些技术和关键问题,对唇区的特征区域标定,静、动态特征表示方面进行了专门研究。本文主要的研究工作如下:1.提出了基于统计的自适应特征区域标定方法。特征区域的标定是唇读特征表示的第一步,本文提出的标定方法首先通过手动标定唇的“红色区域”,然后对其范围进行统计,得到以中心点为基准的最大尺寸,并将统计信息反馈给预处理模块,由预处理模块自动对特征区域重新标定,由此可以使标定尺寸自适应于不同的图片集。这种方法在本文的所有特征表示方法上取得了性能提升。2.基于静态图像的特征表示的研究中,本文对PCA、DCT、Gabor方法在唇读中的应用进行了深入研究和实验对比。针对目前的特征表示方法没有泛化能力的问题进行了探讨,引入一种新的特征描述子:局部二值模式,提出局部二值模式在唇读中的应用方法,该方法具有良好的泛化能力和较快的计算速度,在未来的实用唇读系统中具有很大的应用潜力。3.提出了基于三维时空体的唇读模型,并在模型基础上提出了三维时空体的特征表示方法:唇读的差分型特征表示和积分型特征表示。基于三维时空体的唇读模型结合了空间和时间的双重特点,能够充分表达唇动过程的运动特性。本文探讨了两种基于时空的特征表示方法,从实验对比、理论分析和数学证明三个方面证明了积分型特征在表达能力和可分性上的优势。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究的背景和意义
  • 1.1.1 课题来源
  • 1.1.2 研究的目的和意义
  • 1.2 课题研究现状
  • 1.2.1 唇读系统
  • 1.2.2 研究难点
  • 1.3 本文研究内容
  • 第2章 唇的特征区域标定
  • 2.1 引言
  • 2.2 特征区域粗定位
  • 2.3 基于统计的自适应特征区域标定
  • 2.3.1 标定的语义解释
  • 2.3.2 特征区域的准确标定
  • 2.4 实验与分析
  • 2.4.1 数据库
  • 2.4.2 实验设计
  • 2.4.3 实验结果和分析
  • 2.5 特征区域的标定方法展望
  • 2.6 本章小结
  • 第3章 基于静态图像的特征表示
  • 3.1 引言
  • 3.2 基于像素的特征提取方法
  • 3.2.1 基于统计的主成分分析
  • 3.2.2 基于局部分块的离散余弦变换
  • 3.2.3 Gabor 小波变换
  • 3.2.4 对比实验
  • 3.3 局部二值模式
  • 3.3.1 局部二值模式算子
  • 3.3.2 空间直方图特征的提取
  • 3.3.3 唇读中的LBP 应用及扩展
  • 3.4 本章小结
  • 第4章 基于三维时空体的特征表示
  • 4.1 引言
  • 4.2 相关工作概述
  • 4.2.1 光流法
  • 4.2.2 基于运动矢量的特征表示
  • 4.3 基于时空体的唇读特征表示
  • 4.3.1 三维时空体的定义
  • 4.3.2 基于时空的差分型特征
  • 4.3.3 基于时空的积分型特征
  • 4.4 唇读的特征表示性能比较
  • 4.4.1 时空特征的性能比较
  • 4.4.2 静、动态特征性能比较
  • 4.5 唇读的特征表示方法分析
  • 4.5.1 定性解释
  • 4.5.2 数学描述和证明
  • 4.6 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].趣闻[J]. 知识就是力量 2017(01)
    • [2].唇读也可以智能?[J]. 作文 2017(Z1)
    • [3].有关静态唇读的研究进展及启示[J]. 现代特殊教育 2013(11)
    • [4].解密无声:唇读术突破零证据[J]. 黄金时代(学生族) 2009(09)
    • [5].唇读解密无声[J]. 农村青少年科学探究 2010(Z1)
    • [6].家庭语言环境对成年聋人汉语唇读理解能力的影响研究[J]. 昆明学院学报 2019(02)
    • [7].1946-2017年国际唇读研究进展——基于科学知识图谱的可视化研究[J]. 岭南师范学院学报 2018(02)
    • [8].多用途唇读新技术[J]. 发明与创新(中学生) 2016(07)
    • [9].我国听障学生唇读认知实验研究进展[J]. 中国听力语言康复科学杂志 2018(03)
    • [10].唇读信息对听力损失患者语句识别的影响[J]. 听力学及言语疾病杂志 2014(02)
    • [11].家庭语言环境对听障学生汉语唇读理解的影响[J]. 现代特殊教育 2019(04)
    • [12].高中阶段听障学生汉语唇读理解能力的发展研究[J]. 海南师范大学学报(社会科学版) 2019(02)
    • [13].聋校听障教师与健听教师汉语唇读理解能力比较[J]. 岭南师范学院学报 2019(03)
    • [14].“唇读状元”曾芷君[J]. 现代妇女 2014(02)
    • [15].面孔社会性线索的加工机制[J]. 生理学报 2019(01)
    • [16].听觉辅助在听障学生汉语唇读理解中的作用[J]. 中国特殊教育 2017(10)
    • [17].国内唇读研究对听觉障碍儿童言语康复的启示[J]. 现代特殊教育 2015(12)
    • [18].唇读研究回顾:从聋人到正常人[J]. 华东师范大学学报(教育科学版) 2013(01)
    • [19].听觉辅助对听障成人汉语唇读理解的影响[J]. 现代特殊教育 2018(10)
    • [20].唇读研究进展综述[J]. 计算机工程与设计 2014(06)
    • [21].采用镜前模仿策略干预聋生汉语唇读理解能力的研究[J]. 现代特殊教育 2019(16)
    • [22].谷歌人工智能DeepMind唇读电视节目赛过唇读专家[J]. 数据分析与知识发现 2017(03)
    • [23].正常大学生唇读语音识别编码方式的实验研究[J]. 心理科学 2008(05)
    • [24].听障成人汉语唇读理解能力的发展研究[J]. 中国特殊教育 2020(01)
    • [25].曾芷君:如果我逃避,困难会跟我一生[J]. 意林 2013(20)
    • [26].大龄语前聋人工耳蜗植入者听觉语言康复效果分析[J]. 南方医科大学学报 2011(09)
    • [27].编码方式在听障学生唇读汉语元音识别中的作用研究[J]. 心理科学 2010(04)
    • [28].新冠肺炎疫情下听障人群语言应急服务的思考[J]. 语言战略研究 2020(03)
    • [29].手语和唇读学习网站的设计与实现[J]. 大学教育 2014(17)
    • [30].“吻”书女孩[J]. 家教世界 2014(03)

    标签:;  ;  ;  ;  ;  

    唇读的静动态特征表示方法研究
    下载Doc文档

    猜你喜欢