汉语语音同步的真实感三维人脸动画研究

汉语语音同步的真实感三维人脸动画研究

论文摘要

具有真实感的语音同步人脸动画是当今计算机图形学领域的一个热点问题。它在人机交互、娱乐、影视制作和虚拟现实等方面有着非常多的应用。在过去的三十年中,相关领域取得了长足的发展与进步,但仍存在许多问题亟待解决。其中,如何获得具有高真实感的语音同步人脸动画是一个富于挑战性的课题。该课题涉及个性化人脸的运动学和动力学建模和表示、协同发音机制的建模和表示以及语音驱动人脸动画的主客观评估等诸问题。本文从以下几个方面对语音驱动人脸动画这一富于挑战性的研究课题进行了重点研究。首先,本文在Waters肌肉模型的基础上提出了一种新的嘴唇肌肉模型。针对Waters模型过于简单,不能对复杂的面部动作进行有效建模的问题,本文参考面部解剖学的相关研究成果,提出了一种能够精确描述嘴唇运动的新的嘴唇肌肉模型。该模型将嘴唇的整体运动分解为若干个子运动,并通过各子运动之间的线性组合来表示嘴唇的整体运动。为了合成说话人脸,首先在嘴唇上标记出一些特征点并通过这些特征点获取一组用来描述嘴唇运动的参数。在此基础上,建立嘴唇的运动模型。然后,利用上述嘴唇运动模型和与之相关联的线性肌肉模型,合成各种说话口型。实验结果表明,该嘴唇模型计算代价低、实用性强,是一种有效的嘴唇模型。利用该模型可以合成具有一定真实感的口型动画。其次,在汉语普通话三音子模型和协同发音相关研究成果的基础上,本文提出了一种上下文相关的可视语音协同发音模型。该模型将基于规则集的方法和基于学习的方法进行结合,充分利用两种方法的优点来获得具有真实感的人脸语音动画。我们的模型关注于汉语普通话协同发音的视觉效果。为了得到关键的合成口型,建立了可视语音的协同发音规则集。各音子的相应视位权重可由量化的规则集计算得出。在此基础上,可以合成对应于各音子的口型序列。然后,利用基于学习的方法,从所有的可能选择中获得合成的两音子间的过渡口型,最终得到具有真实感的人脸语音动画。此外,本文还提出了一种新的与语速相关的嘴唇运动模型。在连续语流状态下语速对嘴唇运动的速度和幅度都有很大的影响。研究表明,一些说话人在保持运动速度相对不变的条件下通过增大嘴唇运动幅度来达到增加语速的效果,而另一些人则在保持嘴唇运动幅度不变的前提下通过增大运动速度来实现提高语速的目的。也有一些人通过同时调节嘴唇的运动幅度和运动速度两种参数实现对语速的控制。这表明,在不同的语速条件下,不同人的唇动策略有所不同。基于上述背景知识,本文提出了一种新的具有高度自然度和个性化特征的、与语速相关的嘴唇运动模型。这里,将嘴唇肌肉区域看作一个独立的粘弹性系统,根据EMG信号与语速以及肌肉收缩力之间存在的观测数据得到皮肤肌肉组织和语速以及肌肉收缩力之间的定量关系。依据该嘴唇运动模型,我们构建了一个汉语普通话人脸动画系统。最后,为了对所构建的语音同步人脸动画系统的质量进行评估,本文提出了一种用于汉语可视语音动画质量评估的系统化方法。该方法主要由两种测试步骤构成:可接受性测试与可理解性测试。在可接受性测试中,使用了诊断的可接受性测量方法,并添加进了测试和客观评估相结合的方法。在可理解性评估中,提出了一种新的可视汉语改进押韵测试方法。在该方法中,通过引入“惩罚”与“原谅”因子以模拟人们对于说话人脸的感知。综合两种测试方法可以得到对所提出的三维人脸语音动画系统的总体评估。在前述研究的基础上,我们设计并实现了一个汉语三维人脸语音动画演示系统。该演示系统可以根据所输入的语音和特定人的三维人脸模型生成具有真实感的个性化说话人脸动画。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 人脸语音动画研究的背景和意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义与应用领域
  • 1.2 人脸语音动画的研究内容和本文所研究系统的流程
  • 1.3 人脸语音动画合成的难点
  • 1.4 本文的研究内容和结构安排
  • 1.5 本文的创新之处
  • 第二章 人脸合成与语音动画综述
  • 2.1 人脸建模方法
  • 2.1.1 基于表演驱动的人脸建模方法
  • 2.1.2 基于参数模型的人脸建模方法
  • 2.1.3 基于肌肉模型的人脸建模方法
  • 2.1.4 基于物理模型的人脸建模方法
  • 2.1.5 基于训练学习的人脸建模方法
  • 2.2 语音可视化建模
  • 2.2.1 可视化协同发音模型
  • 2.2.2 语音同步人脸动画技术
  • 2.3 国外主要相关科研机构介绍与国内相关研究
  • 2.3.1 国外主要相关科研机构介绍
  • 2.3.2 国际上主要相关学术会议
  • 2.3.3 国内主要研究介绍
  • 2.4 本章小结
  • 第三章 人脸语音动画中的唇区肌肉模型
  • 3.1 引言
  • 3.1.1 目前的人脸建模方法简述
  • 3.1.2 肌肉模型在人脸建模中的优势以及存在的问题
  • 3.1.3 本章的主要思想
  • 3.2 人脸面部解剖学
  • 3.2.1 唇区附近的人脸面部解剖学梗概
  • 3.2.2 发音时的唇区子运动归纳
  • 3.3 唇区肌肉模型
  • 3.3.1 唇区肌肉模型思想
  • 3.3.2 唇区子运动建模
  • 3.4 实验结果
  • 3.5 本章小结
  • 第四章 语音动画中的可视化协同发音模型
  • 4.1 引言
  • 4.1.1 目前可视语音研究的主要方法与存在的问题
  • 4.1.2 国内的研究成果
  • 4.1.3 本章的主要思想
  • 4.2 可视化协同发音模型
  • 4.3 汉语普通话语音语言学基础
  • 4.4 三音子模型及其可视化协同发音规则
  • 4.4.1 双音子及三音子介绍
  • 4.4.2 三音子结构
  • 4.4.3 音子之间对于所对应口型的相互影响关系
  • 4.5 过渡口型的合成
  • 4.5.1 合成方法概述
  • 4.5.2 PCA方法介绍
  • 4.6 实验结果
  • 4.7 本章小结
  • 第五章 与语速相关的个性化人脸语音动画合成
  • 5.1 引言
  • 5.2 肌肉收缩力与语速的关系
  • 5.2.1 肌电效应
  • 5.2.2 肌肉收缩力与EMG信号的关系
  • 5.2.3 语速与EMG信号的关系
  • 5.3 不同语速下的嘴唇运动模型
  • 5.3.1 人体皮肤肌肉组织的粘弹性力学
  • 5.3.2 语速与唇动的关系
  • 5.4 实验结果
  • 5.4.1 光流法简介
  • 5.4.2 语速-唇动关系模型实验
  • 5.5 本章小结
  • 第六章 语音动画合成的评估
  • 6.1 引言
  • 6.2 可接受性评估
  • 6.3 可理解性评估
  • 6.4 汉语人脸语音动画评估
  • 6.4.1 汉语人脸语音动画的可接受性评估方法
  • 6.4.2 汉语人脸语音动画的可理解性评估方法
  • 6.4.3 实验结果
  • 6.5 本章小结
  • 第七章 汉语普通话人脸动画演示系统
  • 7.1 引言
  • 7.2 系统框架
  • 7.3 系统组成
  • 7.4 汉语三维人脸语音动画演示系统实验结果
  • 7.5 本章小结
  • 第八章 结论与展望
  • 8.1 论文工作总结
  • 8.2 展望
  • 参考文献
  • 致谢
  • 在读期间发表的学术论文
  • 相关论文文献

    • [1].图像驱动的三维人脸自动生成与编辑算法[J]. 计算机辅助设计与图形学学报 2019(01)
    • [2].融合曲面形状和纹理特征的三维人脸识别[J]. 电子测量与仪器学报 2018(09)
    • [3].基于局部特征的三维人脸识别[J]. 现代计算机(专业版) 2016(06)
    • [4].一种侧视图的三维人脸重建方法[J]. 宁波大学学报(理工版) 2016(03)
    • [5].基于矩-傅里叶描述子的不同姿态三维人脸识别[J]. 安徽科技学院学报 2016(03)
    • [6].基于自遮挡的三维人脸重建优化[J]. 数据通信 2016(04)
    • [7].基于深度数据的三维人脸识别[J]. 郑州轻工业学院学报(自然科学版) 2014(06)
    • [8].由粗到精的三维人脸稀疏重建方法[J]. 吉林大学学报(信息科学版) 2013(06)
    • [9].一种基于正面头像的三维人脸建模方法[J]. 考试周刊 2011(84)
    • [10].基于单张图像的三维人脸表情重建研究[J]. 电子测量技术 2020(15)
    • [11].基于分层特征化网络的三维人脸识别[J]. 计算机应用 2020(09)
    • [12].真实感三维人脸建模技术综述[J]. 软件导刊 2018(01)
    • [13].基于单张图像的三维人脸重建[J]. 传感器与微系统 2018(08)
    • [14].基于关键点和局部特征的三维人脸识别[J]. 浙江大学学报(工学版) 2017(03)
    • [15].三维人脸图像的数据采集与预处理[J]. 刑事技术 2015(02)
    • [16].基于信息融合的三维人脸识别[J]. 华南理工大学学报(自然科学版) 2013(11)
    • [17].基于弱监督学习的三维人脸形状与纹理重建[J]. 计算机系统应用 2020(11)
    • [18].基于联合稀疏描述的多姿态三维人脸识别[J]. 西北工业大学学报 2014(03)
    • [19].表情变化的三维人脸特征分析方法[J]. 电子测量与仪器学报 2013(05)
    • [20].基于局部形变模型三维人脸快速建模[J]. 电视技术 2011(03)
    • [21].基于脊谷特征提取的三维人脸识别[J]. 计算机工程与应用 2011(12)
    • [22].基于肤色模型的三维人脸重建[J]. 郑州轻工业学院学报(自然科学版) 2011(06)
    • [23].流形学习在三维人脸特征降维中的应用[J]. 计算机应用研究 2010(10)
    • [24].基于单幅正面照片的三维人脸重建方法[J]. 计算机工程 2010(20)
    • [25].三维人脸识别研究综述[J]. 计算机辅助设计与图形学学报 2008(07)
    • [26].三维人脸图像中特征点的激光定位[J]. 激光杂志 2019(12)
    • [27].基于残差网络的三维人脸识别方法[J]. 内江师范学院学报 2019(06)
    • [28].一种多特征相结合的三维人脸关键点检测方法[J]. 液晶与显示 2018(04)
    • [29].基于卷积神经网络的表情不变三维人脸识别[J]. 电子测量技术 2017(04)
    • [30].基于表情变化的三维人脸识别[J]. 现代计算机(专业版) 2015(05)

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

    汉语语音同步的真实感三维人脸动画研究
    下载Doc文档

    猜你喜欢