基于关联规则挖掘的背景知识攻击及隐私保护研究

基于关联规则挖掘的背景知识攻击及隐私保护研究

论文摘要

为了政务公开、信息共享、科学研究等目的,政府部门、研究机构等数据收集者将收集到的数据进行选择性发布。由于发布的信息中可能涉及个体隐私,如患病情况、消费记录、社会关系等,需要在发布数据的同时进行隐私保护,使攻击者不能以高置信度推断特定个体的敏感信息,以确保隐私信息安全,这就需要对原始数据进行匿名化处理,而数据发布的目的是为了使用和分析数据,所以数据一旦经过了匿名化发布,可用性也随之降低。因此,研究基于隐私保护和高数据可用性的数据发布技术具有理论和现实意义。现有的针对发布数据中敏感信息的攻击和隐私保护可以分为两类,一是直接根据发布的数据进行推断,现在广泛使用的K匿名,L多样性等隐私规则解决此类攻击;另一种是借助攻击者已经掌握的背景知识来推测目标个体的敏感信息,现有的方法是数据发布者假设攻击者可能具备一些特定背景知识,在原有隐私模型的基础上,加入约束,部分的解决了背景知识攻击的问题。但是在连续发布的数据中,攻击者可能利用连续发布的大量数据挖掘关联规则作为背景知识对个人隐私进行攻击,造成隐私信息泄露,现有的方法则尚未有针对性讨论。针对这一问题,本文研究面向连续发布数据的背景知识攻击。利用关联规则对连续发布的数据用准标识符属性和敏感属性之间进行关联,形成正负关联规则作为背景知识。用条件概率表示准标识属性与敏感属性之间的联系,基于概率方法对背景知识建模,使得目标个体与敏感属性之间关联的置信度发生改变从而造成了隐私泄露;使用熵模型度量攻击者获的背景知识带来隐私泄露程度。针对连续发布数据的背景知识攻击问题,本文提出一种新的隐私保护规则(ε,λ)-distinctness和隐私保护算法。(ε,λ)-distinctness规则用于防范攻击者在具有背景知识后推测准标识属性与敏感属性的关联关系,使得攻击者根据背景知识准确推测目标个体的敏感属性的概率不超过1/ε,而不具备背景知识的攻击者推测目标个体的敏感属性的概率不超过1/(ε+λ)。提出(ε,λ)-distinctness规则算法,采用分组的算法,计算满足(ε,λ)-distinctness规则的匿名数据,并分析了(ε,λ)-distinctness隐私保护规则的安全性。本文选用国际上普遍采用Adult数据库,从两个方面实验验证了上述隐私保护方法。在抵御背景知识攻击上,分析比较了(ε,λ)-distinctness规则与Anatomy规则的性能,实验结果表明(ε,λ)-distinctness规则比Anatomy规则相比更能抵御背景知识攻击。在数据可用性和计算效率上,分析比较了(ε,λ)-distinctness规则、Anatomy规则与1 -diversity的性能,实验结果表明,(ε,λ)-distinctness规则有较高的数据可用性和计算效率。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 问题描述
  • 1.3 本文工作
  • 1.4 论文结构
  • 第二章 相关工作
  • 2.1 数据发布中的隐私保护
  • 2.1.1 基本概念
  • 2.1.2 攻击模型
  • 2.1.3 隐私保护的度量标准
  • 2.2 基于限制发布的隐私保护
  • 2.2.1 K-匿名方法
  • 2.2.2 L-多样性方法
  • 2.2.3 M-不变性方法
  • 2.2.4 T-逼近方法
  • 2.2.5 Anatomy方法
  • 2.3 本章小结
  • 第三章 基于关联规则挖掘的背景知识攻击
  • 3.1 背景知识分类
  • 3.2 面向连续发布数据的背景知识获取
  • 3.2.1 问题描述
  • 3.2.2 面向背景知识的关联规则挖掘
  • 3.3 基于概率的隐私泄露量化模型
  • 3.3.1 面向连续发布数据的背景知识建模
  • 3.3.2 基于背景知识的隐私攻击
  • 3.3.3 连续发布数据中的隐私泄露度量
  • 3.4 案例分析
  • 3.5 本章小结
  • 第四章 面向背景知识攻击的隐私保护
  • 4.1 基本概念
  • 4.2 隐私保护规则(ε,λ)-distinctness
  • 4.2.1 (ε,λ)-distinctness规则的形式化描述
  • 4.2.2 (ε,λ)-distinctness规则的隐私保护置信度分析
  • 4.3 满足(ε,λ)-distinctness规则的隐私保护算法
  • 4.3.1 算法描述
  • 4.3.2 算法隐私安全性分析
  • 4.3.3 算法性能分析
  • 4.4 案例分析
  • 4.5 本章小结
  • 第五章 系统实现与数据分析
  • 5.1 实验环境与实验数据
  • 5.2 实验分析
  • 5.3 本章小结
  • 第六章 总结与展望
  • 6.1 全文总结
  • 6.2 工作展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间参与的项目
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].扒一扒 民心网上群众最关心的作风问题[J]. 民心 2014(11)
    • [2].基于医疗数据发布中心的患者病历获取服务[J]. 中国医院管理 2018(11)
    • [3].数据发布中隐私保护技术综述[J]. 信息与电脑(理论版) 2016(17)
    • [4].压力中暗蓄潜力[J]. 纺织服装周刊 2015(40)
    • [5].厂所间异地数据发布技术研究[J]. 航空制造技术 2011(12)
    • [6].食药监管数据发布系统的设计和应用[J]. 中国医药导刊 2017(12)
    • [7].基于WebGIS的地震目录数据发布系统研究[J]. 地震地磁观测与研究 2008(02)
    • [8].基于Flex的数据发布系统的设计与实现[J]. 计算机应用与软件 2011(03)
    • [9].2007年中国印刷及设备器材工业数据发布[J]. 网印工业 2008(06)
    • [10].基于J2EE的数据发布系统设计与实现[J]. 煤炭技术 2011(12)
    • [11].一种基于聚类与分割技术的连续数据发布隐私保护方案[J]. 信息安全研究 2017(10)
    • [12].基于GML的空间数据发布服务[J]. 地理空间信息 2013(01)
    • [13].面向医疗数据发布的动态更新隐私保护算法[J]. 计算机科学 2019(01)
    • [14].70个大中城市房价数据发布[J]. 中国商界 2017(07)
    • [15].社会网络数据发布隐私保护技术研究[J]. 电脑迷 2016(11)
    • [16].浅析国际药品不良反应监测数据发布和反馈[J]. 药物流行病学杂志 2013(09)
    • [17].电视台全台网环境下的新媒体数据发布技术[J]. 有线电视技术 2016(06)
    • [18].基于四原则的关联数据发布方法研究[J]. 图书馆理论与实践 2013(05)
    • [19].基于WinCC Web Navigator的生产数据发布系统[J]. 制造业自动化 2010(09)
    • [20].要闻[J]. 股市动态分析 2008(42)
    • [21].临床数据发布中心集成与开发[J]. 医学信息学杂志 2019(06)
    • [22].面向数据发布和挖掘的隐私保护研究进展[J]. 网络与信息安全学报 2016(01)
    • [23].基于APP端的城市空气质量数据发布系统[J]. 电子技术与软件工程 2016(19)
    • [24].服务器推送技术在气象数据发布中的研究与应用[J]. 广西师范学院学报(自然科学版) 2012(01)
    • [25].2016年11月网络安全监测数据发布[J]. 信息网络安全 2017(01)
    • [26].经济增速连续6年居全国前三——贵州省2016年主要统计数据发布[J]. 当代贵州 2017(Z1)
    • [27].科学基金网上平台数据发布系统的研究[J]. 中国新技术新产品 2014(19)
    • [28].2019年10月网络安全监测数据发布[J]. 信息网络安全 2019(12)
    • [29].2019年9月网络安全监测数据发布[J]. 信息网络安全 2019(11)
    • [30].2017年2月网络安全监测数据发布[J]. 信息网络安全 2017(04)

    标签:;  ;  ;  ;  

    基于关联规则挖掘的背景知识攻击及隐私保护研究
    下载Doc文档

    猜你喜欢