导读:本文包含了近邻分类论文开题报告文献综述及选题提纲参考文献,主要关键词:kNN分类器,加密数据,隐私保护,同态加密
近邻分类论文文献综述
徐剑,王安迪,毕猛,周福才[1](2019)在《支持隐私保护的k近邻分类器》一文中研究指出k近邻(k-nearest neighbor,简称kNN)分类器在生物信息学、股票预测、网页分类以及鸢尾花分类预测等方面都有着广泛的应用.随着用户隐私保护意识的日益提高,kNN分类器也需要对密文数据提供分类支持,进而保证用户数据的隐私性,即设计一种支持隐私保护的足近邻分类器(privacy-preserving k-nearest neighbor classifier,简称PP-kNN).首先,对kNN分类器的操作进行分析,从中提取出一些基本操作,包括加法、乘法、比较、内积等.然后,选择两种同态加密方案和一种全同态加密方案对数据进行加密.在此基础上设计了针对基本操作的安全协议,其输出结果与在明文数据上执行同一方法的输出结果一致,且证明该协议在半诚实模型下是安全的.最后,通过将基本操作的安全协议进行模块化顺序组合的方式实现kNN分类器对密文数据处理的支持.通过实验,对所设计的PP-kNN分类器进行测试.结果表明,该分类器能够以较高效率实现对密文数据的分类,同时为用户数据提供隐私性保护.(本文来源于《软件学报》期刊2019年11期)
郑鲜艳,陈湘,汪芝城,江帆[2](2019)在《基于K近邻字典的协同表示高光谱图像分类方法》一文中研究指出近年来基于协同表示的分类方法在高光谱图像分类领域取得很大的成功.但在重建测试样本时,由于用全部训练样本充当字典,导致一些差别较大的样本参与表示,不仅影响分类的精确度,还浪费分类时间.在实施空-谱联合后,用K近邻对重构字典做出二次选择,并参照最近正则子空间的做法提出基于K近邻字典的协同表示分类器.通过在两个基准HSI数据集上的实验证明,所提分类器既提高了分类精度,还节省了分类时间,特别对小样本类别的分类效果改善更明显.(本文来源于《湖北大学学报(自然科学版)》期刊2019年06期)
蒋芸,肖潇,侯金泉,陈莉[3](2019)在《基于局部正、负标记相关性的k近邻多标记分类新算法》一文中研究指出在多标记学习中,每个样本都由一个实例表示,并与多个类标记相关联。现有的多标记学习算法大多是在全局利用标记相关性,即假设所有的样本共享不同类别标记之间的正相关性。然而,在实际应用中,不同的样本共享不同的标记相关性,标记间不仅存在正相关性,而且存在相互排斥的现象,即负相关性。针对这一问题,提出了基于局部正、负成对标记相关性的k近邻多标记分类算法PNLC。首先,对多标记数据的特征向量进行预处理,分别为每类标记构造对该类标记最具有判别能力的属性特征;然后,在训练阶段,PNLC算法通过所有训练样本中各样本的每个k近邻的真实标记构建标记之间的正、负局部成对相关性矩阵;最后,在测试阶段,首先得到每个测试样例的k近邻及其对应的正、负成对标记关系,利用该标记关系计算最大后验概率对测试样例进行预测。实验结果表明,PNLC算法在yeast和image数据集上的分类准确率明显优于其他常用的多标记分类算法。(本文来源于《计算机工程与科学》期刊2019年10期)
赵琳,行致源[4](2019)在《基于最重要特征的裁剪k-近邻分类算法设计》一文中研究指出k-近邻分类算法是机器学习分类算中一个重要的算法。其精度高具有广泛应用。但时间和空间复杂度高。本文着眼于此,根据香农熵理论,提出了一种通过计算信息增益寻找对分类结果影响最大的特征,并根据该特征进行原始训练集划分并进行样本裁剪构造训练子集,在该子集上应用传统k-近邻的方法,从而降低传统k-近邻分类算法的时间复杂度。实验结果表明,该方法保持了传统k-近邻分类算法的精度,引入了最重要特征对分类结果的影响,有效降低了传统k-近邻分类算法的时间复杂度。(本文来源于《电子设计工程》期刊2019年14期)
刘鹏,杜佳芝,吕伟刚,窦明武[5](2019)在《面向不平衡数据集的一种改进的k-近邻分类器》一文中研究指出心脏心律失常数据集的心电图(ECG)数据往往存在各心律失常类型下样本数量不平衡问题.针对此问题,提出了一种新的模式识别分类方法,即改进的基于核的差重建的加权k-近邻分类器(modified kernel difference-w eighted k-nearest neighbor classifier,M KDF-WKNN),通过引入修正因子对含样本数较多的类别进行权值抑制,对含样本数较少的类别进行权值的加大,并使用UCI心脏心律失常数据集对ECG数据进行分类.实验结果表明,提出的算法和其他一些基于KNN的算法如KNN,DS-WKNN,DF-WKNN和KDF-WKNN相比,对于不平衡的心律失常数据集的分类有更好的效果.(本文来源于《东北大学学报(自然科学版)》期刊2019年07期)
周爱国,王嘉立,杨思静,沈勇,楼狄明[6](2019)在《基于K-means和K近邻的DPF设备故障分类算法》一文中研究指出DPF(柴油微粒过滤器)在使用过程中,由于灰分积累、使用不当等原因易造成DPF堵塞等故障,现有的数据采集设备无法直接反映出设备是否发生故障。针对这一问题,提出了一种基于K-means和KNN的DPF故障分类算法。在K-means++选择初始聚类中心的基础上引入了阈值限定D0,以降低同类型样本被选为后续聚类中心的概率。其次,为了保证聚类数目的真实性,采用层次分析法辅助初步确定聚类参数k,并利用轮廓系数和交叉验证来评估模型。KNN模型利用已分类的样本对来自不同厂家的混合测试样本进行预测,实验结果表明,其预测准确率达到了90%以上,基本实现了DPF设备故障属性分类,为后续维护工作提供了可供参考的依据。(本文来源于《内燃机与配件》期刊2019年12期)
刘悦婷,孙伟刚,张发菊[7](2019)在《一种新的近邻密度SVM不平衡数据集分类算法》一文中研究指出针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新的近邻密度SVM(NNDSVM)不平衡数据集分类算法。该算法先计算多数类中每个样本K近邻范围内的密度值,依据该密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与SVM、ALSMOTE-SVM和WSVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。(本文来源于《贵州大学学报(自然科学版)》期刊2019年03期)
汪献义,邢艳秋,尤号田,邢涛,舒苏[8](2019)在《基于近邻几何特征的TLS林分点云分类研究》一文中研究指出【目的】在地面激光雷达点云分类任务中多存在特征维度较高的问题,然而当点云数量较多,分类任务中构造较高维度的特征往往需要较多的计算成本和运行内存。为了解决这一问题,本研究提出用近邻点构造5个几何特征训练成熟分类器,以期在将林分点云分为地面、树干与枝叶3个类别的同时达到降低特征维度的目的。【方法】在构造特征的过程中采用近邻值为140的快速KDtree搜索近邻点,获得近邻点后利用其计算协方差矩阵特征值、法向量、曲率、方差和最大高程差构造5个几何特征训练分类器。为了检验本研究构造的特征在林分点云分类中的稳定性,分类器分别采用随机森林和xgboost做比较研究。本研究的实验数据均来自地面激光雷达扫描获得的单站蒙古栎人工林点云数据。【结果】使用随机森林和xgboost分类器训练的模型在测试集中正确估计样本数量和样本总量的比值分别为0.932 1和0.936 3。这两个分类器在地面、树干和枝叶这3个类别中的查准率达到0.97、0.93、和0.91以上,且在这3个类别中的分类结果中xgboost较随机森林均有千分级的优势。【结论】结果表明本研究构造的特征能够完成林分点云分类任务,在保证点云分类准确率的基础上,既减少了特征维度,又有助于提高特征计算效率,具有较高的稳定性。本研究的分类结果可为林分参数反演和生物量估计等研究奠定基础。(本文来源于《北京林业大学学报》期刊2019年06期)
黄思源[9](2019)在《加权最近邻空间表征的高光谱遥感图像分类算法研究》一文中研究指出高光谱遥感技术是集成像与光谱探测为一体的光学遥感技术,该技术通过光学系统接收地物反射并获取地面目标像元的光谱信息对地物目标进行识别。目前,针对地面物质信息的高光谱遥感图像分类是一门综合图像处理与遥感成像技术的前沿科研课题。同时,如何提升光谱类似区域的识别能力以及处理效率一直是高光谱遥感图像场景分类的研究重点。因此,本文提出了两种结合光谱和空间信息的场景分类方法,并使用真实的高光谱遥感图像数据验证了本文所提方法的有效性。本文主要的工作概括如下:(1)传统的k-最近邻域(k-Nearest Neighbor,k-NN)方法依赖于欧氏距离作为度量方式来预测测试样本的标签。然而,每个测试样本在进行类别判定时,距离信息的权重分配往往会影响分类精度的提升。因此,本文提出了一种加权最近邻与稀疏表示融合的高光谱图像分类方法,该方法包括以下步骤:首先,对测试像元周围邻域按窗口大小进行联合,形成测试像元的联合区域并获取像元间的欧式距离。其次,利用高斯加权函数对距离信息进行权重分配。最后,融合稀疏表示的重构残差形成新的决策函数。实验结果表明,本文提出的方法有更高的分类精度。(2)高光谱遥感地物样本标定的过程中经常存在不可避免的误标定现象,造成训练样本中含有少量的错误标定样本(即不确定样本)。因此,为了降低不确定样本对监督分类的影响,本文提出了一种基于加权最近邻的峰值密度高光谱图像分类方法。该方法具体步骤如下:首先,利用熵率超像素(Entropy Rate Superpixel,ERS)算法获取训练样本所对应的自适应同质区域。其次,计算同质区域中每个像元之间的欧式距离,同时利用高斯加权函数对距离信息进行权重分配。再次,通过峰值密度聚类算法检测和去除错误标定样本。最后,利用支持向量机来评价该方法的有效性。实验结果表明,本文提出的方法可以有效地检测和去除不确定样本,改善监督分类器的性能。综上,本文针对测试样本的标签预测和训练样本的正确标定问题,提出了光谱-空间联合和不确定样本条件下的分类方法,并通过实验分析证明了所提方法的优越性,为高光谱遥感图像分类研究领域提供了新思路。(本文来源于《湖南理工学院》期刊2019-06-03)
朱雪慧[10](2019)在《闭曲面最近邻分区神经网络分类器的研究与应用》一文中研究指出目前,神经网络已被证明是数据挖掘中一种重要的分类技术,然而,神经网络映射后得到的新空间在不同程度上影响了点的分布并进一步影响分类性能。在之前的研究中,形成的空间被称为“分区空间”,它可能是不规则区域或超球体的内部区域。因此,分区空间的质量也成为神经网络分类器评估的一部分。作为可再划分分区空间的神经网络分类器,最近邻分区方法通过在分区空间中生成任意形状的边界来改进神经网络分类器,但是最近邻分区方法存在着一些问题。一方面,在分区空间中使用具有边界的表面会导致边界问题并限制模型的适用范围;另一方面,具有较低表达能力的前馈神经网络不能充分利用映射的灵活性。因此,本研究描述了一种新颖的闭曲面最近邻分区神经网络分类器来提高分类性能。但是,对于该神经网络分类器在大规模数据集上的应用,降低了模型训练的效率。为了解决这一问题,我们基于GPU对模型进行加速处理,从而提高效率,减少训练时间。此外,由于水泥水化过程中的复杂性,训练过程中需要大量的数据来增加模型的稳健性。因此,用闭曲面最近邻分区方法来评估水泥微观结构性能,并使用并行方法来加速模型训练过程。本文从以下几个方面对闭曲面最近邻分区神经网络分类器进行研究:(1)利用闭曲面最近邻分区方法来提高神经网络分类器的性能本研究中,我们提出了一种闭曲面最近邻分区神经网络分类器,该方法采用闭曲面作为映射样本点的分区空间,进而无边界限制的优化他们的分布。此外,还引入了递归神经网络以通过增加映射关系的灵活性和复杂性来发挥闭曲面的最大优势。一方面,在闭曲面上无边界限制的优化样本点的分布,充分发挥了相同的类相互靠近,不同的类相互远离的原则;另一方面,递归神经网络由于循环链路的存在,具有较强的表达能力,从而增加了找到最佳神经网络的机会。实验结果表明,该方法取得了较好的性能。(2)对闭曲面最近邻分区神经网络分类器进行加速本研究中,提出了一种基于计算统一设备架构的并行闭曲面最近邻分区方法。在该方法中,块和线程分别用于评估潜在的神经网络和执行并行子任务。实验结果表明,所提出的并行方法在确保性能的前提下提高了训练效率,并且在精度上相比于其他的并行方法具有优越的性能。(3)利用闭曲面最近邻分区方法评估水泥微观结构性能首先通过Micro-CT获取水泥图像,并通过灰度直方图和灰度共生矩阵从图像中提取特征作为神经网络分类器的输入。该研究主要是利用闭曲面最近邻分区方法对水泥微观结构的性能进行评估,并利用并行过程进行加速训练,与其他分类方法相比,闭曲面最近邻分区方法在评估水泥性能方面优于其他的分类方法。(本文来源于《济南大学》期刊2019-06-01)
近邻分类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来基于协同表示的分类方法在高光谱图像分类领域取得很大的成功.但在重建测试样本时,由于用全部训练样本充当字典,导致一些差别较大的样本参与表示,不仅影响分类的精确度,还浪费分类时间.在实施空-谱联合后,用K近邻对重构字典做出二次选择,并参照最近正则子空间的做法提出基于K近邻字典的协同表示分类器.通过在两个基准HSI数据集上的实验证明,所提分类器既提高了分类精度,还节省了分类时间,特别对小样本类别的分类效果改善更明显.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
近邻分类论文参考文献
[1].徐剑,王安迪,毕猛,周福才.支持隐私保护的k近邻分类器[J].软件学报.2019
[2].郑鲜艳,陈湘,汪芝城,江帆.基于K近邻字典的协同表示高光谱图像分类方法[J].湖北大学学报(自然科学版).2019
[3].蒋芸,肖潇,侯金泉,陈莉.基于局部正、负标记相关性的k近邻多标记分类新算法[J].计算机工程与科学.2019
[4].赵琳,行致源.基于最重要特征的裁剪k-近邻分类算法设计[J].电子设计工程.2019
[5].刘鹏,杜佳芝,吕伟刚,窦明武.面向不平衡数据集的一种改进的k-近邻分类器[J].东北大学学报(自然科学版).2019
[6].周爱国,王嘉立,杨思静,沈勇,楼狄明.基于K-means和K近邻的DPF设备故障分类算法[J].内燃机与配件.2019
[7].刘悦婷,孙伟刚,张发菊.一种新的近邻密度SVM不平衡数据集分类算法[J].贵州大学学报(自然科学版).2019
[8].汪献义,邢艳秋,尤号田,邢涛,舒苏.基于近邻几何特征的TLS林分点云分类研究[J].北京林业大学学报.2019
[9].黄思源.加权最近邻空间表征的高光谱遥感图像分类算法研究[D].湖南理工学院.2019
[10].朱雪慧.闭曲面最近邻分区神经网络分类器的研究与应用[D].济南大学.2019