稀疏学习及其在多标记学习中的应用研究

稀疏学习及其在多标记学习中的应用研究

论文摘要

机器学习是一种旨在设计和实现特定算法,使得计算机能够根据经验数据进化自身行为。它隶属于计算机科学中的人工智能范畴,也是近来人工智能学科研究最活跃的子领域。机器学习的研究在计算机视觉,自然语言处理,生物信息学和生物医学等领域有着广泛的应用。稀疏性作为数据的重要特征,可以大为简化数据的表示,减少计算,并且更容易获得对于数据“宏观”特征的把握。在各种实际问题中广泛存在着稀疏性,利用这些稀疏性更好地提高解决实际问题算法的性能,这是机器学习/数据挖掘领域有趣而重要的研究内容。在本文中,我们通过挖掘不同实际问题的特征引出不同的稀疏学习模型。通过回顾作为稀疏学习理论基础的不定线性方程组的稀疏解理论了解到l1约束的优化问题在稀疏学习中所起的作用。并通过线性回归问题为减小方差而进行的特征选择引出LASSO算法。通过LASSO算法在针对群组变量选取,树形结构特征选择以及图上的相关性挖掘任务中的应用介绍了Group LASSO, Tree Group LASSO以及稀疏逆协方差估计。这些广泛应用的稀疏模型是利用稀疏性求解新问题的基础。为了高效地求解不同稀疏学习模型,我们探究了多种方法。传统的坐标下降受到收敛性问题的困扰以及二阶算法需要更大的时间空间开销促使我们寻求迭代中更容易计算的一阶黑盒方法。Nesterov的针对光滑的凸优化问题的O( 1√? )的算法提供了稀疏学习求解的框架。而该框架中需要解决的重要步骤便是向l1球上的投影。我们回顾了当前优秀的枢纽元算法以及零点算法,通过他们的求解变量,求解步骤以及时间复杂度分析阐述了二者之间的等价性,并提出了一种基于两次二分过程的改进的零点算法,在保持求解效率的同时降低了编程复杂度。在传统基于实例的多标记学习中,我们经常陷入选择相似性度量以及邻域大小的困难境地。针对该问题,我们试图建立一个自适应邻域,以避免对于相似性度量以及邻域大小选择。受稀疏表示在人脸识别中的应用的启发,我们通过一个类似稀疏表示的优化问题来确定该自适应邻域,该问题有着同稀疏学习相同的复杂度但有着对于邻域信息更好的解释性。基于该自适应邻域,我们设计的加权和算法能够实现对于多标记数据的分类过程。在公共数据集上的实验显示,自适应邻域算法能够获得比当前state-of-the-art算法更好的性能。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 机器学习
  • 1.2 稀疏学习及其应用
  • 1.3 多标记学习及其应用
  • 1.4 本文主要工作
  • 1.5 本文内容安排
  • 第二章 稀疏学习理论,模型及其应用
  • 2.1 稀疏学习简介
  • 2.2 理论基础--不定线性方程组稀疏解理论
  • 2.2.1 稀疏解模型
  • 2.2.2 稀疏解唯一性
  • 2.3 稀疏学习模型及应用
  • 2.3.1 LASSO
  • 2.3.2 Group LASSO
  • 2.3.3 Tree Group LASSO
  • 2.3.4 稀疏逆协方差矩阵估计
  • 2.4 本章小结
  • 第三章 稀疏学习求解研究
  • 3.1 相关工作
  • 3.1.1 Basis Pursuit
  • 3.1.2 Least Angle Regression
  • 3.1.3 其他算法
  • 1球投影算法'>3.2 l1球投影算法
  • 3.2.1 枢纽元算法
  • 3.2.2 零点算法
  • 3.2.3 枢纽元算法与零点算法等价性讨论
  • 3.2.4 零点算法改进
  • 1球投影算法的稀疏学习求解算法'>3.3 基于l1球投影算法的稀疏学习求解算法
  • 3.4 本章小结
  • 第四章 多标记学习的自适应邻域算法
  • 4.1 简介
  • 4.2 相关工作
  • 4.2.1 多标记分类
  • 4.2.2 ML-KNN 算法
  • 4.2.3 IBLR-ML 算法
  • 4.2.4 基于稀疏表示的分类
  • 4.3 自适应邻域(AN)算法
  • 4.3.1 问题描述
  • 4.3.2 我们的方法
  • 4.3.3 同已有工作的比较
  • 4.4 实验
  • 4.4.1 评估方法
  • 4.4.2 数据集
  • 4.4.3 参数设定
  • 4.4.4 实验结果与分析
  • 4.5 本章小结
  • 第五章 总结与展望
  • 5.1 已有工作总结
  • 5.2 未来工作展望
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 相关论文文献

    • [1].个性化推荐中的数据稀疏性问题研究[J]. 网友世界 2014(07)
    • [2].基于时频稀疏性的跳频信号时频图修正方法[J]. 宇航学报 2013(06)
    • [3].结合总变差和组稀疏性的压缩感知重构方法[J]. 兵器装备工程学报 2017(11)
    • [4].一种缓解互惠推荐系统中数据稀疏性的算法[J]. 济南大学学报(自然科学版) 2017(01)
    • [5].基于代理函数优化的稀疏性字典学习[J]. 电子学报 2011(12)
    • [6].基于结构稀疏性的单次曝光相位成像算法[J]. 电子与信息学报 2017(07)
    • [7].基于字典稀疏性的脑图像数据盲分离方法[J]. 计算机工程 2015(12)
    • [8].协同过滤系统的矩阵稀疏性问题的研究[J]. 计算机应用 2010(04)
    • [9].一种有效缓解数据稀疏性的混合协同过滤算法[J]. 计算机应用 2009(06)
    • [10].一种缓解协同过滤算法数据稀疏性的方法[J]. 软件 2015(03)
    • [11].一种缓解数据稀疏性的协同过滤推荐系统[J]. 烟台职业学院学报 2011(04)
    • [12].基于稀疏性约束非负矩阵分解的人脸年龄估计方法[J]. 山东大学学报(理学版) 2010(07)
    • [13].张量稀疏性度量综述[J]. 重庆邮电大学学报(自然科学版) 2019(03)
    • [14].考虑稀疏性的多特征电力负荷功率实时分解[J]. 电力系统及其自动化学报 2018(02)
    • [15].基于空域稀疏性的方位依赖阵列误差校正算法[J]. 电子与信息学报 2017(09)
    • [16].利用参数稀疏性的卷积神经网络计算优化及其FPGA加速器设计[J]. 电子与信息学报 2018(06)
    • [17].基于结构化事件的主题表示[J]. 计算机应用研究 2017(03)
    • [18].基于稀疏性贝叶斯极限学习机的气动调节阀多类故障诊断[J]. 上海应用技术学院学报(自然科学版) 2015(03)
    • [19].稀疏性正则化非负矩阵分解的在线学习方法[J]. 模式识别与人工智能 2013(03)
    • [20].利用阵列协方差矩阵稀疏性的到达角估计方法[J]. 国防科技大学学报 2020(05)
    • [21].基于稀疏性的图像去噪综述[J]. 计算机应用研究 2012(02)
    • [22].基于优化最小化的加强稀疏性的稀疏信号恢复算法[J]. 上海大学学报(自然科学版) 2018(04)
    • [23].采用空间稀疏性的单星无源定位方法[J]. 电信科学 2016(04)
    • [24].基于频域稀疏性的间歇采样转发干扰识别[J]. 空军预警学院学报 2015(05)
    • [25].一种卷积神经网络的稀疏性Dropout正则化方法[J]. 小型微型计算机系统 2018(08)
    • [26].GIS绝缘子表面金属异物缺陷长间歇稀疏性局放检测研究[J]. 高压电器 2018(11)
    • [27].基于稀疏性的相位谱补偿语音增强算法[J]. 信号处理 2020(11)
    • [28].概率型稀疏核Logistic多元分类机[J]. 电子与信息学报 2011(07)
    • [29].基于主题扩展的校园论坛热点话题发现方法与系统[J]. 西藏大学学报(自然科学版) 2016(02)
    • [30].一种稀疏性增强的人脸识别改进算法[J]. 信息技术 2016(12)

    标签:;  ;  ;  ;  ;  

    稀疏学习及其在多标记学习中的应用研究
    下载Doc文档

    猜你喜欢