核矩阵低秩分解与核空间信息能度量研究及应用

核矩阵低秩分解与核空间信息能度量研究及应用

论文摘要

模式分类中的核方法在实际应用中获得了较为成功的应用,其良好的性能在于不仅能高效地对数据间存在的非线性关系进行模式分析,而且核方法本身建立在严格的统计分析基础之上,与线性统计分析方法一样有坚实的理论基础。但是核方法在处理大规模数据分类任务时存在如下问题:一方面,核方法的计算复杂度较高,其算法的设计和求解与训练样本个数有关,且常见的经典算法采用凸二次优化策略,对于大规模数据集,需要较高的时间和空间复杂度;另一方面,由于核空间为高维甚至无限维,其间样本具有多模式、多态性,因此相似性不便于描述。针对上述问题,本文主要探讨了核矩阵的低秩分解和核空间的相似性测度。一是从特征选择和矩阵分解的角度考虑如何学习较优的低秩近似核矩阵。二是从基于距离的度量来考虑核空间中高维数据的特性。在此基础上,结合已有算法分别进行了比较分析,用基于核矩阵低秩分解与信息能度量的核方法实现高维多模式对象的特征提取和模式分类,实验结果验证了算法的有效性。总的来说,本文的主要工作包括如下五个方面:1.针对核矩阵分解算法时间复杂度较高的问题,研究了如何对核矩阵进行低秩分解。常用的矩阵低秩分解算法均可以视为无监督算法,本文通过分析核矩阵中行/列与类别的相关性,结合已有的矩阵分解运算,提出了有监督的核矩阵低秩分解方法,最后给出核矩阵低秩近似误差界的期望值。实验证明核矩阵分解过程中,行/列的选取对分类效果有较大影响,在保证分类性能的前提下,本文算法能在一定程度上提高核机器学习效率,为大规模数据集中的应用奠定了良好的基础;2.核方法在低维数据中已经取得了较为成功的应用,然而在高维数据中,由于数据包含更为丰富的内在结构,因此常用的相似性测度如欧氏距离面临分类效果较低的困境。通过研究非距离的度量问题,提出了新的信息能度量,该方法满足距离的度量公理,且不仅适用于低维数据,同时可以有效挖掘高维数据中的相似性结构,实验结果验证了该相似性测度的正确性;3.研究了核空间中的特征提取问题。基于提出的信息能度量,结合梯度上升方法,提出了新的特征提取算法。该算法在应用于大规模数据集时,可以采用核矩阵的低秩近似分解来有效降低运算复杂度,且无须预先进行特征选择。同时信息能的梯度信息可以描述特征的聚集趋势,有利于指导分类任务;4.基于提出的信息能度量,通过研究已有的最近邻算法和其核化形式,对其进行改进,提出了新的核k-最近邻算法。该算法有效结合了近邻法和核方法的特性,有较好的物理意义,且能由此模型推出经典的互信息度量,因此具有良好的理论基础和推广能力;5.对已有的细胞表型图形态差异学习算法进行核化,提出新的基于信息能度量的核形态差异学习算法,并设计了一系列最优参数选择方案,保证了实验效果,为核方法在该领域的进一步应用奠定了基础。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 核方法简述
  • 1.2 核方法研究进展
  • 1.3 核方法的关键问题分析
  • 1.4 论文研究目的和意义
  • 1.5 论文研究内容及安排
  • 第二章 核矩阵的低秩近似分解
  • 2.1 核矩阵低秩近似分解简介
  • 2.2 基于熵和 Nystr(o|¨)m 的低秩分解算法
  • 2.2.1 信息熵与 Nystr(o|¨)m 分解简述
  • 2.2.2 分解算法设计
  • 2.2.3 核矩阵低秩分解实验与性能分析
  • 2.3 基于主元选取和列相关的分解算法
  • 2.3.1 QR 分解与不完全 Cholesky 分解
  • 2.3.2 列相关定义
  • 2.3.3 分解算法设计
  • 2.3.4 不同分类器及主元选取方法实验
  • 2.4 核矩阵低秩近似误差界的估计
  • 2.5 算法时间复杂度分析
  • 2.6 本章小结
  • 第三章 核空间中的相似性测度
  • 3.1 相似性测度重要性
  • 3.2 信息能度量
  • 3.2.1 信息能度量定义
  • 3.2.2 与互信息度量比较
  • 3.3 相似性测度实验结果与分析
  • 3.4 本章小结
  • 第四章 基于核矩阵低秩分解和信息能度量的特征提取
  • 4.1 问题描述
  • 4.2 算法设计
  • 4.3 目标函数优化策略的确定
  • 4.4 实验结果与分析
  • 4.4.1 降维效果及信息能梯度信息实验
  • 4.4.2 真实数据分类性能实验
  • 4.5 本章小结
  • 第五章 基于信息能度量的核k-最近邻算法
  • 5.1 引言
  • 5.2 核k-最近邻算法
  • 5.2.1 最近邻算法的核化
  • 5.2.2 算法设计
  • 5.2.3 与已有算法比较分析
  • 5.3 实验结果与分析
  • 5.3.1 小规模数据集测试实验
  • 5.3.2 大规模数据集测试实验
  • 5.4 本章小结
  • 第六章 基于信息能度量的核形态差异学习算法
  • 6.1 形态差异学习简述
  • 6.2 基于信息能度量的核形态差异学习
  • 6.3 实验结果与分析
  • 6.3.1 形态差异定量分析实验
  • 6.3.2 算法的鲁棒性能分析
  • 6.4 本章小结
  • 第七章 结论与展望
  • 7.1 本文的主要结论
  • 7.2 进一步的工作
  • 致谢
  • 参考文献
  • 作者攻读博士期间的研究成果和参加的科研项目
  • 相关论文文献

    • [1].基于3×3核矩阵的极化码性能分析[J]. 现代电子技术 2019(09)
    • [2].基于特征距离的组合核矩阵模型选择标准[J]. 计算机工程与科学 2008(11)
    • [3].2M维矢量余弦整数变换核矩阵[J]. 光学精密工程 2013(07)
    • [4].高维核矩阵极化码的蒙特卡洛设计方法[J]. 计算机时代 2018(04)
    • [5].优化支持向量机核参数的核矩阵方法研究[J]. 烟台大学学报(自然科学与工程版) 2013(02)
    • [6].一种基于稀疏编码的多核学习图像分类方法[J]. 电子学报 2012(04)
    • [7].基于核矩阵降维算法对药物不良反应的预测[J]. 中国科技论文 2017(24)
    • [8].BEC信道下高维核矩阵极化码的精确设计[J]. 无线电通信技术 2019(03)
    • [9].基于核矩阵等距映射的无线传感网络节点定位算法[J]. 华东师范大学学报(自然科学版) 2019(01)
    • [10].基于循环核矩阵的自适应目标跟踪算法[J]. 计算机工程与应用 2016(20)
    • [11].基于QR分解的稀疏LSSVM算法[J]. 吉林大学学报(理学版) 2018(02)
    • [12].某些Mercer核矩阵的权范数[J]. 数学物理学报 2013(01)
    • [13].一种基于密度聚类Nystrom抽样算法[J]. 计算机工程与科学 2012(11)
    • [14].KMA-α:一个支持向量机核矩阵的近似计算算法[J]. 计算机研究与发展 2012(04)
    • [15].抽样子空间约束改进大数据谱聚类算法[J]. 电信科学 2018(11)
    • [16].一种基于抽样改进加权核K-means的大数据谱聚类算法[J]. 测绘通报 2018(11)
    • [17].基于p范数的QR-KPCA人脸识别算法[J]. 西安理工大学学报 2015(01)
    • [18].基于核矩阵扩展的动态光散射截断奇异值分解反演[J]. 光子学报 2018(07)
    • [19].基于多核矩阵结构处理器的Sobel图像处理[J]. 中国科技信息 2013(01)
    • [20].基于电路网络的多图融合[J]. 中国科学技术大学学报 2013(01)
    • [21].使用迭代方法求解核主成分分析[J]. 小型微型计算机系统 2013(08)
    • [22].基于免疫核主元分析的故障诊断方法[J]. 清华大学学报(自然科学版) 2008(S2)
    • [23].核方法驱动的本体函数迭代算法[J]. 昆明学院学报 2019(06)
    • [24].一种基于蒙特卡洛的快速极化码构造方法[J]. 计算机工程 2019(09)
    • [25].极化码的编码构造[J]. 电视技术 2018(06)
    • [26].半定规划支持向量机模型的研究[J]. 计算机工程与设计 2011(05)
    • [27].核矩阵列相关低秩近似分解算法[J]. 模式识别与人工智能 2011(06)
    • [28].基于入侵检测的特征提取方法[J]. 计算机应用与软件 2010(06)
    • [29].基于核方法的图像快速加密算法[J]. 电路与系统学报 2010(03)
    • [30].基于一种新的交换矩阵的离散分数阶傅立叶变换实现[J]. 信号处理 2010(04)

    标签:;  ;  ;  ;  ;  

    核矩阵低秩分解与核空间信息能度量研究及应用
    下载Doc文档

    猜你喜欢