隐私保护关联规则挖掘算法的研究

隐私保护关联规则挖掘算法的研究

论文摘要

信息时代给我们带来了数据在数量和复杂性上的爆炸性增长,也催生了富有挑战性的研究领域:数据挖掘。在很多情况下,数据由不同的组织持有,分布于不同的地理位置,而且持有者可能出于数据安全性和敏感性等原因不愿意直接共享他们的数据。怎样跨越数据挖掘和数据隐私性之间的这道鸿沟进行各种研究和应用,是当前数据挖掘的一大研究方向,称为保护隐私的数据挖掘。本文在综述了国内外关联规则挖掘研究成果的基础上,对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的介绍和分析。本文针对MASK算法存在的不足,将随机响应技术与关联规则挖掘算法相结合,提出一个多参数随机扰动算法—MRD算法。当以不同的随机参数对数据集进行处理时,可以实现对原始数据的干扰或隐藏,解决了单一使用数据干扰策略和数据隐藏策略的缺陷,有效地提高了算法的隐私保护度。在此基础上,给出了在伪装后的数据集上生成频繁项集的挖掘算法。最后,本文通过具体实例,表明当算法中的参数选择合适时,MRD算法的隐私性和准确性均优于原算法。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 隐私保护数据挖掘的研究现状
  • 1.3 研究内容与组织结构
  • 第2章 关联规则挖掘算法概述
  • 2.1 数据挖掘
  • 2.1.1 数据挖掘概述
  • 2.1.2 数据挖掘研究前景
  • 2.2 关联规则挖掘
  • 2.2.1 关联规则挖掘基本概念
  • 2.2.2 关联规则挖掘算法的分类
  • 2.2.3 关联规则挖掘算法概述
  • 2.3 本章小结
  • 第3章 隐私保护数据挖掘算法综述
  • 3.1 问题的描述
  • 3.2 基于关联规则的隐私保护挖掘算法
  • 3.2.1 数据集中分布
  • 3.2.3 数据分布式分布
  • 3.3 基于分类的隐私保护挖掘算法
  • 3.3.1 基于启发式技术
  • 3.3.2 基于重建式技术
  • 3.4 本章小结
  • 第4章 多参数随机扰动关联规则挖掘算法
  • 4.1 随机响应技术与关联规则挖掘算法的结合
  • 4.1.1 随机响应技术
  • 4.1.2 随机响应技术与关联规则挖掘算法的结合
  • 4.2 MASK算法思想
  • 4.3 多参数随机扰动算法
  • 4.3.1 问题的提出
  • 4.3.2 多参数随机扰动算法的提出
  • 4.3.3 项集支持度的重构
  • 4.4 生成频集过程
  • 4.5 算法性能衡量标准
  • 4.5.1 隐私保护度的衡量
  • 4.5.2 挖掘准确度的衡量
  • 4.5.3 复杂性的衡量
  • 4.6 实验结果分析
  • 4.7 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文及参加的项目
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    隐私保护关联规则挖掘算法的研究
    下载Doc文档

    猜你喜欢