论文摘要
降维方法是处理高维数据的一个重要手段,数据的降维处理方面已经有了大量的研究工作。降维的主要目的是将原始数据对应的高维空间数据映射至低维空间的流形,前提是尽可能的保证数据间的几何关系和距离测度不变。这样不仅能在以后的相关计算中减少许多数据量,而且也去除了大数据量的冗余信息,从而提高识别的精度和时间效率。以PCA为代表的线性流形学习算法具有较强的数学基础,实现简单,但是其线性本质并不能揭示复杂的非线性流形。于是又出现了以主曲线、ISOMAP、LLE、LE等为代表的非线性流形学习算法。实验表明了流形学习的降维过程在精度上并没有明显的损失,而在时间效率上有着显著的提高。首先,本文介绍了当前主要流形学习算法的原理及典型算法,对算法性能进行了分析。针对当前的流形学习算法的适用环境及性能进行可视化分析,并着重讲述了如何建立主曲线的算法问题。然后针对当前的语音识别模型中存在的语音帧的病态假设以及高维数据问题,利用流形学习具有对数据集约简维数处理后仍能保持数据集的邻域关系的特点,将流形学习的多边形线算法用于语音识别特征参数提取后的约简维数问题;最终建立基于主曲线的双音素轨迹子空间模型。考虑流形学习算法的广泛应用前景,论文将流形学习算法引入海量图像数据的预处理中。提出将流形学习用于WEB图像的检索分类中。针对RGB色彩空间不符合人的肉眼感知的缺陷,给出一种基于HSV色彩空间的彩色图像降维及分类方法。实验证明,该方法在基于内容的图像检索中具有积极意义。
论文目录
摘要Abstract第1章 绪论1.1 研究目的和意义1.2 流形学习研究现状1.2.1 流形学习定义1.2.2 流形学习国内外研究现状1.3 语音信号处理技术研究概况1.4 基于内容的图像检索技术研究概况1.4.1 图像检索技术介绍1.4.2 基于内容的图像检索技术研究现状1.5 论文的结构安排第2章 流形学习算法介绍2.1 全局线性流形学习算法2.1.1 主成分分析(PCA)2.1.2 Fisher线性辨别分析(LDA)2.1.3 多维尺度变换(MDS)2.2 基于谱图理论的非线性流形学习算法2.2.1 等距映射(ISOMAP)2.2.2 局部线性嵌入(LLE)2.2.3 拉普拉斯特征映射(Laplacian Eigenmaps)2.2.4 Hessian特征映射(Hessian Eigenmap)2.2.5 核主成分分析(Kernel Principal Component Analysis)2.2.6 局部切空间排列(LTSA)2.2.7 扩散映射(Diffusion Map)2.3 主曲线理论2.3.1 HS主曲线2.3.2 T主曲线2.3.3 D主曲线2.3.4 多边形主曲线2.4 流形学习算法性能分析2.4.1 谱图理论流形学习算法性能分析2.4.2 主曲线算法性能分析2.5 本章小结第3章 语音信号预处理3.1 语音识别基元的选取3.2 语音信号预处理3.2.1 放大、滤波、A/D转换3.2.2 预加重3.2.3 分帧3.2.4 加窗3.2.5 端点检测3.3 语音特征参数提取3.3.1 线性预测(LPC)及其倒谱系数(LPCC)3.3.2 Mel频率倒谱系数(MFCC)3.4 本章小结第4章 基于多边形线建立双音素子空间模型4.1 多边形主曲线算法4.2 多边形线算法在双音素建模中的具体实现4.2.1 TC-PCA方法的应用4.2.2 多边形主曲线建模4.3 实验结果和性能分析4.4 本章小结第5章 基于HSV空间的彩色图像降维及分类5.1 颜色特征的提取5.2 彩色图像ISOMAP的降维及分类的实现5.2.1 基于HSV空间的图像ISOMAP的降维及分类算法步骤5.2.2 图像空间转换及量化5.3 实验结果及数据分析5.3.1 ISOMAP算法与PCA算法分类性能比较5.3.2 图像降维前与ISOMAP降维后检索性能比较5.4 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果致谢
相关论文文献
标签:流形学习论文; 多边形线论文; 语音子空间模型论文;