表情映射论文-赫工博

表情映射论文-赫工博

导读:本文包含了表情映射论文开题报告文献综述及选题提纲参考文献,主要关键词:对抗生成网络,卷积神经网络,人脸表情生成

表情映射论文文献综述

赫工博[1](2019)在《基于多域映射对抗生成网络的人脸表情生成》一文中研究指出深度卷积神经网络的发展使得人类生活更进一步的智能化,其应用范围包括:自动驾驶、智能零售、智能金融服务、智能安防等各行各业。从最初的分类网络开始(Alex NET、Google NE等)逐步发展为各种各样拥有其独特功能的深度神经网络,其中经典的分类网络包括:Res NET、VGG16、Se NET等。而分类网络的内部层结构作为深度神经网络特征提取的基础至今依然在不断发展。在分类网络的基础之上也衍生出了结构较为复杂的目标检测网络和对抗生成网络。如SSD、YOLO、Faster RCNN、Mask RCNN等目标检测网络已经被工业界所广泛应用。对抗生成网络的出现是在2014年,Goodfellow首次提出了让两个卷积神经网络互相对抗并从对方的损失中获得反馈进行优化的自学习网络GAN,其功能在于让生成器网络能够生成逼真的图片,赋予了机器以想象力。本文通过对已有的对抗生成网络算法进行研究,分析其内在数学原理,并对现今较为流行的多映射的GAN结构在人脸表情生成方面做出了相应的改进,通过增加抑制函数解决了生成图片中注意力掩码的饱和问题,通过神经网路检测的人脸关键点信息的引入进一步增加生成网络注意力的方式优化算法结果,实现了不改变图片背景的前提下前景的自然转换以及满足插值性的融合。GAN的本质是一个高维概率分布参数估计,然而由于训练数据是分布中离散点的形式,且训练过程只能通过采样的方式求期望,所以在满足生成图片逼真的前提下就较难保证多样性,保证多样性的前提下就较难保证生成图片的逼真。因此在传统GAN的损失函数及网络结构和训练方式下,往往会出现训练难以收敛,调参困难,模式坍塌等问题。本文通过对当前有效降低这些问题的算法进行了分析,并对多映射对抗生成网络做出了有效的改进,对实验结果进行了分析。(本文来源于《吉林大学》期刊2019-05-01)

宋佳丽[2](2019)在《面部表情建模及映射技术合成研究》一文中研究指出在虚拟现实、图像处理等技术快速前进的情况下,表情移植技术也逐步吸引图像及视频领域研究者的目光。本文主要研究基于特征点差向量的表情移植方法,其中涉及到卷积神经网络、递归神经网络及表情映射算法等技术。特征提取是表情移植过程中非常重要的一步,相比传统算法,卷积神经网络在处理特征提取时可避免由初始人脸引起的定位误差,但目前的卷积神经网络普遍以越深的网络提取更为精确的特征点的趋势搭建,这将导致较大的计算复杂度。此外,卷积神经网络无法预测存在时序关联的特征,如:头部、眼神特征信息,而递归神经网络可提取时序关联的特征信息,因此本文着重研究如何充分结合二者优势解决同时提取时序关联和非时序关联特征的问题。为了实现人脸移植效果,将提取出的3D特征数据重建为人脸叁角网格,并根据叁角网格计算控制动画人脸表情变化的形变系数。针对整个实现过程存在的问题,本文在标准卷积网络中引入一种轻量级结构并将其改进为叁维模型,并且提出一种新的复合型结构以解决如何结合两大模型的问题,同时提出使用一种表情移植算法实现将初始人脸的表情移植到某个动画人物模型面部的效果。在实验环节,由于目前公开的面部、头部、眼神的3D数据集较少,本文标注了训练及测试模型所需的数据集,实验结果证明本研究提出的算法可快速实现较为真实的追踪效果。本文主要内容如下:(1)本文梳理了人脸表情移植技术的实现方法及近几年的发展情况。阐述了人脸表情移植技术的基本流程,分析和研究了现有的面部特征提取技术、头部及眼神的特征信息提取技术以及数据映射技术的研究现状与可改进之处。(2)通过对人脸特征提取技术的分析,本文设计出一个轻量级卷积神经网络(Light-Weight Convolutional Neural Network,LW-CNN),该模型基于可分离卷积结构搭建,能以较少的参数提出较为精确的特征,计算复杂度大大降低,主要用于人脸3D特征点的提取。为增强特征提取的精确度,在模型提取特征之前先采用一个基于倒叁角结构的人脸检测方法对训练集中的图像进行人脸框检测。(3)考虑到表情移植效果的真实性,本文基于LW-CNN模型搭建出一个复合模型,即复合型递归卷积神经网络(Hybrid Recurrent Convolutional Networks,HRCNs),该模型考虑到LW-CNN在提取非时序关联信息上的精确性与快速性以及LSTM模型在处理时序关联信息上的有效性搭建而来。为评估HRCNs模型的性能,本文从两个角度对算法的精确度展开测试,分别为归一化均值误差和均方根误差,最终实验结果证明本算法可以提取出较为精确和稳定的特征点。考虑到算法应用的广泛性,本文采用基于特征点差向量的表情映射算法实现表情移植,最终被映射人脸可清晰展示出较为细微的表情变化。(4)由于公开的3D人脸数据集较少,本文标注了训练模型所需的3D人脸数据集,其中标签文件包括面部68个特征点、左右两眼及头部姿势特征信息,最终共准备了4万张左右的人脸数据。(本文来源于《电子科技大学》期刊2019-04-01)

曹誉文[3](2017)在《基于特征映射的多角度人脸表情识别》一文中研究指出人的面部表情蕴含着丰富的情感信息,也是人们除了语言、文字、声音之外比较重要的沟通方式。现在大多数针对人脸表情识别的研究都是针对正面人脸进行,然而正面人脸表情是对表情理想化的表达。现实生活中,采集设备可能会从各个角度捕捉表情数据。因此,针对多角度人脸表情图像进行识别,提出鲁棒性更强的人脸表情识别算法,在人机交互领域有着重大的意义。由于公开的多角度人脸表情库较少,以及算法方面的限制,针对多角度表情识别的研究十分有限。现有的多角度人脸表情识别方法包括针对每个角度训练不同的分类器,或者用一个单独的分类器学习所有的角度。然而,这些方法忽略了不同角度的人脸表情仅仅是相同表情的不同表现。因此,本文在研究正面人脸表情识别的基础上,提出了用神经网络进行特征映射的方法,将多角度表情特征映射为正面表情特征再进行分类,提高了多角度表情识别中角度方面的鲁棒性。主要工作有以下几个方面:首先,介绍了人脸表情识别的研究背景和意义,从人脸检测、特征提取和分类识别叁个方面,总结了人脸表情识别的研究现状,并研究了目前现有的正面表情识别与多角度表情识别算法,在比较分析了各种算法的优缺点后,确定了用特征映射解决多角度表情识别问题的思路。并进行了人脸检测、图像预处理等工作,选择了对方向和尺度不敏感的金字塔式梯度方向直方图特征作为本文的特征。第二,设计实现了多角度人脸表情识别中的特征映射方法。RBF网络不仅结构简单,还有着较强的非线性映射能力和自学习能力,特别是局部逼近能力和学习速度表现优异。因此本文选择了径向基神经网络进行多角度表情特征到正面表情特征的映射工作。第叁,设计了多角度人脸表情识别的算法框架,在提取的PHOG特征的基础上,研究了k近邻分类器与稀疏表示分类器,并分析了融合的k近邻稀疏表示分类器。实验对改进前后的稀疏表示分类器的平均识别率与运行时间都进行了比较,结果表明,k近邻稀疏表示分类器在大大减少运行时间的同时,对人脸表情也具有一定的分类能力。第四,本文建立了山东大学多角度人脸表情数据库,该数据库包含了 10个人在7个姿态角度下的6类基本表情的彩色数据与深度数据,7个姿态角度用7个摄像头同时采集。此外,介绍了人脸表情识别中常用的几个公开数据库,包括正面人脸表情数据库CK+和JAFFE,以及多角度人脸表情数据库Multi-PIE,并在这些公开的数据集以及自建的数据集上进行了正面人脸表情识别以及多角度表情识别的实验。(本文来源于《山东大学》期刊2017-05-23)

韩涛[4](2017)在《基于比率图的表情映射机器视觉》一文中研究指出脸部的表情不仅显示了脸部动态特征,还显示了脸部外观的微妙变化,例如脸部的褶皱和皱纹。这些很重要的细节特征很难合成。传统的表情映射技术只考虑动态特征,但在光照强度变化时细节特征经常被忽略。为了获得脸部表情的细节特征,提出了一种表情映射新方法——利用表情比率图捕捉表情细节特征,精确获得此特征强度变化,产生更多脸部表情。通过实验对比,得到表情比率图对于脸部表情细节特征更具有鲁棒性和可靠性的结论。(本文来源于《科学技术与工程》期刊2017年14期)

王艳,张忠波[5](2017)在《基于线性等距映射面部表情非线性流形估计》一文中研究指出为改善面部表情研究领域算法的识别效果,提出基于局部线性等距映射面部表情非线性流形估计算法。首先,针对多元冗余信息处理所导致的计算复杂度大幅增加的问题,利用等距映射过程(ISOMAP)和局部表情的线性嵌入过程(LLE)构建新的数据降维方法,可对高维的输入数据进行保守的近邻无监督训练;其次,利用Isomap和LLE实现输入数据的低维坐标映射,实现面部表情的局部聚类识别;最后,通过在Frey Raw数据库测试表明,所提方法在面部表情的非线性流形结构识别率及计算时间指标上要优于选取的对比算法,可有效对人脸表情及文本文字等信息进行处理。(本文来源于《控制工程》期刊2017年01期)

赵思阳,张卫华,周激流[6](2016)在《基于多重流形嵌入的局部线性嵌入与等距映射面部表情估计方法》一文中研究指出对于传统的局部线性嵌入(LLE)算法在给定数据集中无法学习多重流形信息与等距映射(ISOMAP)算法在展现数据内在几何形态不足的特性,为提高面部表情图像的分类精度,提出了一种基于多重流形嵌入的LLE与ISOMAP面部表情估计方法。该算法分别通过LLE和ISOMAP两种流形学习对面部表情图像集进行分类训练,并得到数据的细化二维映射结果,再通过二维表情分布图将两种分类数据进行融合与重排列。为验证融合的可行性,实验通过流行学习对表情数据进行分类与标记,利用五折交叉验证,将数据定义为五种不同表情,并引入表情的识别率对融合算法与两种传统算法进行对比。融合算法使低维数据不但具有数据间的局部线性关系,同时也保证了数据间的全局映射关系。仿真结果表明,融合算法在特定K近邻(KNN)范围内取得较高的识别率和较低的重构误差,基本满足对高维图像实时处理的要求。(本文来源于《计算机应用》期刊2016年S2期)

付晓峰,付晓鹃,李建军,余正生[7](2015)在《视频序列中基于多尺度时空局部方向角模式直方图映射的表情识别》一文中研究指出针对局部二元模式在概念上是无方向性的,不能充分捕捉详细信息的问题,提出局部方向角模式(LOP)方法.该方法通过比较2个近邻点上2个方向角的差值来标注图像中的像素点,对邻域内方向角差值的变化进行编码;将LOP扩展到叁维空间,提出时空局部方向角模式(SLOP),将从3个正交平面上提取到的特征串接成一个向量;最后采用多尺度SLOP直方图作为人脸表征,并将其投影到保局映射空间以获取低维特征.在Cohn-Kanade与MMI人脸表情数据库上的实验结果表明,文中方法在识别准确率和识别速度方面都优于已有方法.(本文来源于《计算机辅助设计与图形学学报》期刊2015年06期)

张剑[8](2010)在《融合SFM和动态纹理映射的视频流叁维表情重建》一文中研究指出为从未标定的单目视频序列中重建出具有真实感的叁维人脸表情序列,提出一种仅需较少约束的自动化方法.首先用ASM算法从视频首帧自动标定人脸特征,并采用仿射矫正光流方法跟踪运动中的人脸特征;然后结合一般人脸模型,采用从运动恢复形状的方法重建出叁维个性化人脸模型以及表情运动;最后采用动态纹理映射来代替传统的静态纹理映射,以产生真实感视觉外观.另外,使用基于特征脸的图像压缩方法,在尽量保持图像质量的前提下缩小原始视频占用的存储空间.实验结果表明,该方法能产生具有相当真实感的叁维人脸表情序列,且在时间域和空间域上都保持了较高性能.(本文来源于《计算机辅助设计与图形学学报》期刊2010年06期)

支瑞聪,阮秋琦[9](2009)在《基于线性判别局部保留映射的人脸表情识别》一文中研究指出随着人机交互技术的发展,情感计算成为一个研究热点。局部保留映射(LPP)是一种最优的保持数据集局部结构的一种线性映射,它的特点是保留了样本的局部结构,但是它没有考虑判别信息,从而容易引起类间距离小的类别之间的重迭。本文提出了基于线性判别的局部保留映射(DLPP)算法并将其应用到表情识别问题中。与LPP相比,DLPP的改进之处在于将判别分析的思想引入LPP。同时考虑样本间的相邻关系和模式类之间的相邻关系,从而得到能正确分类的最优投影方向。在Yale人脸库和JAFFE表情库中的一系列表情识别实验结果表明,DLPP对于人脸表情识别更为有效。(本文来源于《信号处理》期刊2009年02期)

付晓峰,韦巍[10](2009)在《基于高级局部二元模式直方图映射的表情识别》一文中研究指出提出高级局部二元模式直方图映射(ALBPHP)方法,将标记信息完整且标记位置统一的高级局部二元模式(ALBP)直方图映射到局部保持投影(LPP)空间获得低维ALBPHP特征.相比于ALBP特征,ALBPHP特征不仅维数低而且在表征人脸图像时具有更强的鉴别力.在JAFFE和Cohn-Kanade两个人脸表情库上对ALBPHP和ALBP方法比较验证,结果表明:采用相同的分类器时ALBPHP的识别率总是高于ALBP.(本文来源于《模式识别与人工智能》期刊2009年01期)

表情映射论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在虚拟现实、图像处理等技术快速前进的情况下,表情移植技术也逐步吸引图像及视频领域研究者的目光。本文主要研究基于特征点差向量的表情移植方法,其中涉及到卷积神经网络、递归神经网络及表情映射算法等技术。特征提取是表情移植过程中非常重要的一步,相比传统算法,卷积神经网络在处理特征提取时可避免由初始人脸引起的定位误差,但目前的卷积神经网络普遍以越深的网络提取更为精确的特征点的趋势搭建,这将导致较大的计算复杂度。此外,卷积神经网络无法预测存在时序关联的特征,如:头部、眼神特征信息,而递归神经网络可提取时序关联的特征信息,因此本文着重研究如何充分结合二者优势解决同时提取时序关联和非时序关联特征的问题。为了实现人脸移植效果,将提取出的3D特征数据重建为人脸叁角网格,并根据叁角网格计算控制动画人脸表情变化的形变系数。针对整个实现过程存在的问题,本文在标准卷积网络中引入一种轻量级结构并将其改进为叁维模型,并且提出一种新的复合型结构以解决如何结合两大模型的问题,同时提出使用一种表情移植算法实现将初始人脸的表情移植到某个动画人物模型面部的效果。在实验环节,由于目前公开的面部、头部、眼神的3D数据集较少,本文标注了训练及测试模型所需的数据集,实验结果证明本研究提出的算法可快速实现较为真实的追踪效果。本文主要内容如下:(1)本文梳理了人脸表情移植技术的实现方法及近几年的发展情况。阐述了人脸表情移植技术的基本流程,分析和研究了现有的面部特征提取技术、头部及眼神的特征信息提取技术以及数据映射技术的研究现状与可改进之处。(2)通过对人脸特征提取技术的分析,本文设计出一个轻量级卷积神经网络(Light-Weight Convolutional Neural Network,LW-CNN),该模型基于可分离卷积结构搭建,能以较少的参数提出较为精确的特征,计算复杂度大大降低,主要用于人脸3D特征点的提取。为增强特征提取的精确度,在模型提取特征之前先采用一个基于倒叁角结构的人脸检测方法对训练集中的图像进行人脸框检测。(3)考虑到表情移植效果的真实性,本文基于LW-CNN模型搭建出一个复合模型,即复合型递归卷积神经网络(Hybrid Recurrent Convolutional Networks,HRCNs),该模型考虑到LW-CNN在提取非时序关联信息上的精确性与快速性以及LSTM模型在处理时序关联信息上的有效性搭建而来。为评估HRCNs模型的性能,本文从两个角度对算法的精确度展开测试,分别为归一化均值误差和均方根误差,最终实验结果证明本算法可以提取出较为精确和稳定的特征点。考虑到算法应用的广泛性,本文采用基于特征点差向量的表情映射算法实现表情移植,最终被映射人脸可清晰展示出较为细微的表情变化。(4)由于公开的3D人脸数据集较少,本文标注了训练模型所需的3D人脸数据集,其中标签文件包括面部68个特征点、左右两眼及头部姿势特征信息,最终共准备了4万张左右的人脸数据。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

表情映射论文参考文献

[1].赫工博.基于多域映射对抗生成网络的人脸表情生成[D].吉林大学.2019

[2].宋佳丽.面部表情建模及映射技术合成研究[D].电子科技大学.2019

[3].曹誉文.基于特征映射的多角度人脸表情识别[D].山东大学.2017

[4].韩涛.基于比率图的表情映射机器视觉[J].科学技术与工程.2017

[5].王艳,张忠波.基于线性等距映射面部表情非线性流形估计[J].控制工程.2017

[6].赵思阳,张卫华,周激流.基于多重流形嵌入的局部线性嵌入与等距映射面部表情估计方法[J].计算机应用.2016

[7].付晓峰,付晓鹃,李建军,余正生.视频序列中基于多尺度时空局部方向角模式直方图映射的表情识别[J].计算机辅助设计与图形学学报.2015

[8].张剑.融合SFM和动态纹理映射的视频流叁维表情重建[J].计算机辅助设计与图形学学报.2010

[9].支瑞聪,阮秋琦.基于线性判别局部保留映射的人脸表情识别[J].信号处理.2009

[10].付晓峰,韦巍.基于高级局部二元模式直方图映射的表情识别[J].模式识别与人工智能.2009

标签:;  ;  ;  

表情映射论文-赫工博
下载Doc文档

猜你喜欢