隐私保护离群点检测算法的研究

隐私保护离群点检测算法的研究

论文摘要

隐私保护数据挖掘技术的目标是在不泄露隐私信息的前提下,使用数据挖掘工具得到准确的挖掘结果,随着人们对隐私问题的日益关注,已成为一个重要的研究方向,目前主要从两个方面进行研究:数据扰乱技术和安全多方计算技术。研究人员已经提出许多隐私保护关联规则算法、分类算法和聚类算法,但隐私保护离群点检测的算法很少。目前隐私保护离群点检测算法主要是基于距离的算法,通过使用安全多方计算技术中一些通用的安全协议对算法中的隐私信息进行保护,算法复杂度高,数据安全性和可靠性难以满足用户需求;且没有考虑到通信负载的问题,将应用安全协议的集中式离群点检测算法直接应用于分布式数据集,易产生隐私泄露且算法的效率低。本文结合安全多方计算技术、数据扰乱方法和离群点检测算法对以上不足之处进行改进,主要工作如下:(1)构造安全向量和的第k值协议,以该协议和数据扰乱技术为基础,针对数据垂直分割的情况,提出半诚实模型下基于距离的分布式隐私保护离群点检测算法VPPDTk-Outlier。理论分析与实验均表明:与同类型算法相比较,VPPDTk-Outlier算法拥有近似线形的通信复杂度,提高了通信效率。(2)分析基于密度的集中式离群点检测算法DBOM的特点,以此算法为基础,结合数据分布方式,提出基于密度的垂直分布式离群点检测算法VDBOM,详细介绍了算法的思想和流程,并从理论和实验两个方面分析和证明了算法能够有效克服DBOM算法应用于分布式数据集时所产生的效率低下问题。(3)构造安全交集协议和安全比较协议,以此协议为基础,提出了半诚实模型下基于密度的分布式隐私保护离群点检测算法PPVDBOM,解决了VDBOM算法所存在的隐私泄露问题,理论证明所提算法能很好地隐藏数据,有效保护信息的安全。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 本文研究背景和意义
  • 1.2 国内外研究现状
  • 1.3 论文主要工作
  • 1.4 论文组织结构
  • 第二章 离群点检测及隐私保护概述
  • 2.1 离群点检测
  • 2.1.1 离群点检测概述和常用技术
  • k-Outlier离群点检测算法'>2.1.2 top-n DTk-Outlier离群点检测算法
  • 2.1.3 DBOM离群点检测算法
  • 2.2 数据挖掘中的隐私问题
  • 2.2.1 隐私的概念
  • 2.2.2 数据挖掘中的隐私保护问题
  • 2.3 隐私保护数据挖掘常用的方法
  • 2.3.1 数据扰乱技术
  • 2.3.2 随机响应技术
  • 2.3.3 安全多方计算
  • 2.3.4 可交换加密机制
  • 2.3.5 同态加密机制
  • 2.4 隐私保护数据挖掘算法的分类
  • 2.5 隐私保护数据挖掘算法的评估指标
  • 2.6 本章小结
  • 第三章 构造安全协议
  • 3.1 相关概念
  • 3.2 安全交集协议
  • 3.2.1 协议描述
  • 3.2.2 协议分析
  • 3.3 安全比较协议
  • 3.3.1 协议描述
  • 3.3.2 协议分析
  • 3.4 安全向量和的第k值协议
  • 3.4.1 协议描述
  • 3.4.2 协议分析
  • 3.5 本章小结
  • 第四章 基于距离的分布式隐私保护离群点检测算法
  • k-Outlier算法思想'>4.1 VPPDTk-Outlier算法思想
  • k-Outlier算法描述'>4.2 VPPDTk-Outlier算法描述
  • k-Outlier安全性算法分析'>4.3 VPPDTk-Outlier安全性算法分析
  • k-Outlier通信代价和计算复杂度分析'>4.4 VPPDTk-Outlier通信代价和计算复杂度分析
  • 4.5 实验
  • 4.6 本章小结
  • 第五章 基于密度的分布式隐私保护离群点检测算法
  • 5.1 相关概念
  • 5.2 基于密度的垂直分布式离群点检测算法VDBOM
  • 5.2.1 VDBOM算法思想
  • 5.2.2 VDBOM算法分析
  • 5.3 基于密度的分布式隐私保护离群点检测算法
  • 5.3.1 PPVDBOM算法描述
  • 5.3.2 算法安全性分析
  • 5.3.3 算法计算代价和通信花销分析
  • 5.4 实验
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 工作总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的学术论文
  • 相关论文文献

    • [1].基于集成方法的离群点检测算法研究[J]. 电子世界 2020(06)
    • [2].基于局部估计密度的局部离群点检测算法[J]. 小型微型计算机系统 2020(02)
    • [3].基于插值的高维稀疏数据离群点检测方法[J]. 计算机工程与科学 2020(06)
    • [4].离群点检测算法的评价指标[J]. 计算机应用 2020(09)
    • [5].离群点识别方法研究[J]. 软件导刊 2019(06)
    • [6].基于离群点检测和分类的软测量方法[J]. 山东化工 2018(09)
    • [7].基于地统计学的空间离群点检测算法的研究[J]. 计算机应用研究 2016(12)
    • [8].基于高频关键词的离群点监测与异类知识研究——从文献分析视角[J]. 情报杂志 2017(05)
    • [9].离群点检测概述[J]. 信息系统工程 2017(05)
    • [10].一种分布式计算的空间离群点挖掘算法[J]. 测绘科学 2017(08)
    • [11].一种基于多标记的局部离群点检测算法[J]. 微电子学与计算机 2017(10)
    • [12].基于改进的离群点检测软测量方法研究[J]. 自动化与信息工程 2015(04)
    • [13].基于集合论估计的电网状态辨识 (四)离群点识别[J]. 电力系统自动化 2016(08)
    • [14].异质网中基于张量表示的动态离群点检测方法[J]. 计算机研究与发展 2016(08)
    • [15].一种基于多示例学习的局部离群点检测算法[J]. 信息与控制 2016(04)
    • [16].集成电路中用于离群点测试选择的总体框架[J]. 工业控制计算机 2014(11)
    • [17].关联子空间离群点挖掘[J]. 小型微型计算机系统 2015(05)
    • [18].基于距离的数据流离群点快速检测[J]. 世界科技研究与发展 2013(04)
    • [19].离群点检测算法在药品不良反应异常信号挖掘中的应用[J]. 现代养生 2017(06)
    • [20].从数学的角度初步看离群点检测算法[J]. 环球市场信息导报 2017(36)
    • [21].一种个性化k近邻的离群点检测算法[J]. 小型微型计算机系统 2020(04)
    • [22].一种面向混合属性数据的邻域粒离群点检测[J]. 小型微型计算机系统 2020(04)
    • [23].基于多相关性的传感数据离群点检测与处理[J]. 测控技术 2020(04)
    • [24].基于主动学习的离群点集成挖掘方法研究[J]. 计算机工程与应用 2020(12)
    • [25].聚类剪枝算法在离群点检测中的应用[J]. 广东通信技术 2018(12)
    • [26].基于多示例学习的局部离群点改进算法[J]. 计算机工程与应用 2019(18)
    • [27].一种改进隔离森林的快速离群点检测算法[J]. 小型微型计算机系统 2019(11)
    • [28].一种基于密度的离群点检测方法[J]. 西南科技大学学报 2018(01)
    • [29].离群点检测技术在教育教学中的应用[J]. 现代教育技术 2018(06)
    • [30].基于图像的重建点云离群点检测算法[J]. 数据采集与处理 2018(05)

    标签:;  ;  ;  ;  ;  

    隐私保护离群点检测算法的研究
    下载Doc文档

    猜你喜欢