![隐私保护关联规则挖掘算法的研究](https://www.lw50.cn/thumb/d406199f2cfde6d09d97ab7d.webp)
论文摘要
信息时代给我们带来了数据在数量和复杂性上的爆炸性增长,也催生了富有挑战性的研究领域:数据挖掘。在很多情况下,数据由不同的组织持有,分布于不同的地理位置,而且持有者可能出于数据安全性和敏感性等原因不愿意直接共享他们的数据。怎样跨越数据挖掘和数据隐私性之间的这道鸿沟进行各种研究和应用,是当前数据挖掘的一大研究方向,称为保护隐私的数据挖掘。本文在综述了国内外关联规则挖掘研究成果的基础上,对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的介绍和分析。本文针对MASK算法存在的不足,将随机响应技术与关联规则挖掘算法相结合,提出一个多参数随机扰动算法—MRD算法。当以不同的随机参数对数据集进行处理时,可以实现对原始数据的干扰或隐藏,解决了单一使用数据干扰策略和数据隐藏策略的缺陷,有效地提高了算法的隐私保护度。在此基础上,给出了在伪装后的数据集上生成频繁项集的挖掘算法。最后,本文通过具体实例,表明当算法中的参数选择合适时,MRD算法的隐私性和准确性均优于原算法。
论文目录
摘要Abstract第1章 绪论1.1 研究背景1.2 隐私保护数据挖掘的研究现状1.3 研究内容与组织结构第2章 关联规则挖掘算法概述2.1 数据挖掘2.1.1 数据挖掘概述2.1.2 数据挖掘研究前景2.2 关联规则挖掘2.2.1 关联规则挖掘基本概念2.2.2 关联规则挖掘算法的分类2.2.3 关联规则挖掘算法概述2.3 本章小结第3章 隐私保护数据挖掘算法综述3.1 问题的描述3.2 基于关联规则的隐私保护挖掘算法3.2.1 数据集中分布3.2.3 数据分布式分布3.3 基于分类的隐私保护挖掘算法3.3.1 基于启发式技术3.3.2 基于重建式技术3.4 本章小结第4章 多参数随机扰动关联规则挖掘算法4.1 随机响应技术与关联规则挖掘算法的结合4.1.1 随机响应技术4.1.2 随机响应技术与关联规则挖掘算法的结合4.2 MASK算法思想4.3 多参数随机扰动算法4.3.1 问题的提出4.3.2 多参数随机扰动算法的提出4.3.3 项集支持度的重构4.4 生成频集过程4.5 算法性能衡量标准4.5.1 隐私保护度的衡量4.5.2 挖掘准确度的衡量4.5.3 复杂性的衡量4.6 实验结果分析4.7 本章小结结论参考文献攻读硕士学位期间发表的论文及参加的项目致谢
相关论文文献
标签:数据挖掘论文; 关联规则论文; 频繁项集论文; 隐私保护论文; 随机响应论文;