论文摘要
基于生物特征识别的身份鉴别技术提供了一种高可靠性、高稳定性的身份鉴别方式。在各种生物特征识别技术中,人脸识别是一项极具发展潜力的生物特征识别技术,在信息安全、公共安全、金融等领域具有广阔的应用前景。人脸识别又是一个非常活跃的研究领域,涉及计算机视觉、模式识别、图像处理、机器学习和认知科学等多门学科,人脸识别研究成果会促进这些学科的发展。对人脸识别技术的研究具有巨大的应用价值和重要的理论意义。近二十年来,人脸识别取得了很大进展,但在实际应用中仍然存在许多尚未解决的问题。通常情况下,在观测空间中获得的人脸图像数据是维数很高且是非结构化的原始数据,这些数据不仅存在维数过大问题,而且也不能清晰反映出检测对象的内在本质,因此不宜直接在观测空间中对数据进行分类。这就需要对数据集进行特征提取,通过科学提取反映对象本质的特征数据,可在实现降维的同时保持数据集原有的重要本质结构特性不变。将人脸识别分类工作,从原观测空间转换到特征子空间中进行,合理的降维既能排除众多噪音的干扰,又可加速处理计算,使识别处理更加有效。子空间方法是目前特征提取和识别的主流方法。子空间方法能否有效取得预期的效果,关键在于特征的选取与构造是否科学合理。实际中,许多被识别对象的超高维数据变异仅是由于有限数目条件变化引起,在分析其变异关系时,可以认为上述高维数据并不是无序的散布在整个高维空间,而是集中在空间内部某种低维流形上。这种流形反映了上述高维数据的内在结构,且这种低维流形可能与人的认知流形是一致的。基于上述原理和认识,流形学习原理近年颇受重视,并得到了很大发展。流形学习的目标是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形子空间,并求出相应的嵌入映射,以实现数据降维。在流形学习数据降维映射中,最重要的是要正确地嵌入内蕴局部邻域关系。本文以流形学习方法为基础,进行了嵌入邻域映射的子空间人脸识别算法研究。在邻域映射中引入类判别信息,从而提高了子空间算法的识别率,具体研究包括:1.进行了基于散度差判别邻域嵌入的人脸识别算法的研究在描述用于识别的人脸特征方面,以往主流的方法为PCA、LDA等子空间方法,这些方法在较为理想的条件下取得了重要的研究成果。但是,这些方法更多的是考虑数据集的全局线性特性,在处理实际复杂高维数据集时难免受到很大程度上的制约。流形学习理论试图揭示数据集的内蕴结构以获得对问题的本质研究。局部保持投影(LPP)和邻域保持投影(NPP)分别是流形学习方法拉普拉斯特征映射(Laplacian Eigenmap)和局部线性嵌入(LLE)的线性近似。这两种方法都具有保持局部结构属性,而没有考虑类判别信息。本文在结合局部线性嵌入(LLE)和拉普拉斯特征映射(LE)两种方法基础上,提出了一种新的子空间学习方法,称为散度差判别邻域嵌入(SDDNE)。在该算法中,训练样本数据的邻域和类关系被有效结合用来构建低维嵌入流形。在嵌入低维子空间后,同类样本保持它们固有的近邻几何结构关系,而不同类样本则彼此分离。另外,该算法还避免了小样本问题。实验表明该算法可以取得更好的识别率。2.提出一种基于非线性正交化核局部Fisher判别嵌入人脸识别算法研究一种称为局部Fisher判别嵌入(LFDE)监督学习方法。由于该方法求取的鉴别矢量不是正交的,这就使得鉴别矢量张成的空间与原空间存在尺度上的变化,由此提出了正交局部Fisher判别嵌入(OLFDE)方法。但是它本质还是线性学习方法。由于线性的分类算法无法提取数据的非线性分布特征,因此无法获得更高识别率。核映射是一种广泛使用的非线性映射方法。非线性核映射理论思想来源支持向量机,设法将输入空间升维,以使在原始空间中的线性不可分问题转化为高维空间中线性可分(或接近线性可分)问题;由于升维后只是改变了内积运算,并没有使算法的复杂度随着维数的增加而增加。这里,在正交局部Fisher判别嵌入算法基础上,巧妙的引入核映射,提出了基于正交核局部Fisher判别嵌入算法(OKLFDE)。该算法继承了正交局部Fisher判别嵌入方法的优点,且能有效地提取非线性特征。实验结果表明,该方法能有效简化人脸模式的复杂分布,且能较大幅度的提高分类效果。3.提出了一种基于图像矩阵判别局部保持投影人脸识别算法局部保持投影(LPP)算法同传统子空间方法(如LDA)一样,只能处理一维向量型的数据,当处理人脸图像二维矩阵型数据时,需要首先将矩阵按逐行或逐列展开为向量,由于人脸图像数据维数较高,远远大于样本的个数,容易形成小样本问题,不利于算法的求解。另外,人脸图像信息本来就是二维相关的,展开为一维,破坏了空间结构关系;直接在二维图像矩阵上进行子空间分析,原理上更为合理。为此,提出了一种基于图像矩阵判别局部保持投影方法(IMDLPP),它直接处理二维的图像矩阵而不需要将矩阵转化为向量,保留了像素间的空间位置关系,避免了奇异性问题。同时IMDLPP通过考虑类标签信息来保持类内局部关系,还将类间的散度约束引入到目标函数中,使求解的特征具有更强的区分性。实验结果表明了该方法的有效性。