距离度量学习的理论与算法研究:核回归、大间隔最近邻与Fisher线性判别

距离度量学习的理论与算法研究:核回归、大间隔最近邻与Fisher线性判别

论文摘要

距离度量学习已经在回归,聚类和分类等任务上发挥了重要的作用。本文分别在核回归、大间隔最近邻分类和Fisher线性判别分类上进行距离度量的理论与算法研究。传统的核回归使用的是欧式距离,该距离将所有特征间的差别平等对待,不能很好的揭示内部结构。与欧式距离不同,马氏距离将特征间的差别分别对待,并且不受样本量纲大小的影响,可以很好的揭示内部结构。我们将马氏距离与传统的核回归相结合的模型应用于短时的交通流量预测,并使用梯度下降法进行参数估计。通过在实际交通流量数据上的实验,证明了该方法的有效性。最近提出的大间隔最近邻分类方法大幅度提高了K近邻分类的性能。但现实世界中的数据往往都呈现局部性,而大间隔最近邻分类所获得的却是一个全局度量。因此我们提出了一种新的局部度量方法——逐级度量学习的方法来进一步改进大间隔最近邻分类的性能。通过多组人工数据集和实际数据集的实验,证明了改进算法的高效性。距离度量学习的目标之一是使同类的样本之间的距离尽量缩小,不同类样本之间的距离尽量的扩大。Fisher线性判别的思想与距离度量的学习目标十分一致。在现实世界中,大多数物体都拥有多个属性,而这些属性往往又可以被分成多个组。传统的Fisher线性判别将所有的属性都归到一起进行学习。我们将多视角学习与Fisher线性判别相结合,提出了一种新的多视角Fisher线性判别。此外,传统的Fisher线性判别多类类间散度是通过每类的均值和总均值之间的差值计算的,该算法没有考虑样本分布的局部性。为了使我们提出的多视角Fisher线性判别更好得适用于多类数据集,因此我们进而将该方法与逐级度量学习相结合,提出了基于逐级度量学习的多视角Fisher线性判别。最后,通过多组人工数据集的和实际数据集的实验,证明了该算法的有效性。

论文目录

  • 论文摘要
  • ABSTRACT
  • 目录
  • 第1章 绪论
  • 1.1 论文研究的背景
  • 1.2 相关工作
  • 1.3 论文的研究目标
  • 1.4 本文的内容和组织结构
  • 第2章 基于马氏距离的核回归
  • 2.1 普通的回归模型
  • 2.2 核回归
  • 2.3 马氏度量学习
  • 2.4 实验
  • 2.4.1 数据描述和设置
  • 2.4.2 实验结果
  • 2.4.3 异常结果的分析
  • 2.5 本章小结
  • 第3章 基于逐级度量的大间隔最近邻分类
  • 3.1 大间隔最近邻分类
  • 3.1.1 目标近邻
  • 3.1.2 目标函数
  • 3.1.3 凸优化
  • 3.2 逐级度量学习的必要性
  • 3.3 聚类标准
  • 3.3.1 已有的聚类标准
  • 3.3.2 重叠率
  • 3.4 聚类
  • 3.5 分类
  • 3.6 实验
  • 3.6.1 人工数据集
  • 3.6.2 实际数据集
  • 3.7 本章小结
  • 第4章 基于逐级度量学习的多视角Fisher线性判别分析
  • 4.1 Fisher线性判别
  • 4.1.1 Fisher线性判别的基本思想
  • 4.1.2 两类情况的类内散度和类间散度
  • 4.1.3 多类情况的类内散度和类间散度
  • 4.2 基于逐级度量学习的Fisher线性判别分析
  • 4.2.1 用逐级度量的必要性
  • 4.2.2 逐级度量学习的Fisher判别分析
  • 4.2.3 学习过程
  • 4.2.4 分类
  • 4.3 多视角的Fisher线性判别
  • 4.3.1 已有模型简介
  • 4.3.2 多视角的Fisher线性判别
  • 4.3.3 分类方法
  • 4.4 基于逐级度量学习的多视角Fisher线性判别
  • 4.4.1 学习过程
  • 4.4.2 分类
  • 4.5 实验
  • 4.5.1 对比的方法
  • 4.5.2 参数设置
  • 4.5.3 人工数据集
  • 4.5.4 实际数据集
  • 4.6 本章小结
  • 第5章 总结
  • 参考文献
  • 致谢
  • 攻读硕士学位期间参加的项目及发表的学术论文
  • 相关论文文献

    • [1].基于自然最近邻相似图的谱聚类[J]. 计算机应用研究 2020(01)
    • [2].基于距离的相似最近邻搜索算法研究[J]. 北京化工大学学报(自然科学版) 2017(05)
    • [3].静音钻[J]. 科学启蒙 2017(Z1)
    • [4].一种连续最近邻查询的优化方法[J]. 黑龙江工程学院学报(自然科学版) 2013(04)
    • [5].基于新型索引结构的反最近邻查询[J]. 计算机研究与发展 2020(06)
    • [6].基于自然最近邻的离群检测方法研究[J]. 智能计算机与应用 2019(04)
    • [7].概率可视最近邻查询算法[J]. 哈尔滨理工大学学报 2013(06)
    • [8].基于R树及其变种的最近邻查询研究[J]. 现代计算机 2013(09)
    • [9].道路网络中的多类型K最近邻查询[J]. 计算机工程与应用 2012(03)
    • [10].不确定数据上范围受限的最近邻查询算法[J]. 小型微型计算机系统 2012(06)
    • [11].k最近邻域分类算法分析与研究[J]. 甘肃科技 2012(18)
    • [12].基于路网的连续K最近邻查询[J]. 天津理工大学学报 2012(06)
    • [13].不确定对象的反向最近邻查询研究[J]. 黑龙江工程学院学报(自然科学版) 2012(04)
    • [14].范围最近邻查询方法研究[J]. 泰山学院学报 2011(03)
    • [15].反向最近邻查询研究综述[J]. 电脑知识与技术 2011(28)
    • [16].空间数据库中的障碍反向最近邻查询[J]. 计算机工程与应用 2011(34)
    • [17].道路网络中的连续最近邻查询[J]. 计算机工程 2010(08)
    • [18].时空数据库变体最近邻查询问题探讨[J]. 计算机工程与应用 2010(14)
    • [19].空间对象的双色反向最近邻查询研究[J]. 煤炭技术 2009(06)
    • [20].最近邻搜索用于分类问题的一种改进[J]. 南京大学学报(自然科学版) 2009(04)
    • [21].路网环境中关于模糊组最近邻问题的研究[J]. 计算机应用研究 2016(02)
    • [22].最近邻检索问题综述[J]. 新西部(理论版) 2015(09)
    • [23].基于k-最近邻的红外点目标检测方法(英文)[J]. 红外与激光工程 2013(S2)
    • [24].平面中点对一般多边形的最近邻查询研究[J]. 科技通报 2014(01)
    • [25].面向不确定数据的概率阈值可见最近邻查询算法[J]. 小型微型计算机系统 2013(08)
    • [26].面向存在不确定对象的组最近邻查询方法[J]. 小型微型计算机系统 2012(04)
    • [27].空间数据库中连续可视反向最近邻查询[J]. 西南交通大学学报 2012(03)
    • [28].基于查询集空间分布的聚合最近邻查询算法[J]. 计算机应用 2011(09)
    • [29].面向不确定图的k最近邻查询[J]. 计算机研究与发展 2011(10)
    • [30].高维主存的反向K最近邻查询及连接[J]. 计算机工程 2011(24)

    标签:;  ;  ;  ;  ;  

    距离度量学习的理论与算法研究:核回归、大间隔最近邻与Fisher线性判别
    下载Doc文档

    猜你喜欢