数据垂直分布的隐私保护数据挖掘算法研究

数据垂直分布的隐私保护数据挖掘算法研究

论文摘要

随着网络、通信技术的迅猛发展,数据挖掘呈现出海量化、分布式等特点,如何保护数据挖掘过程中的隐私数据和防止敏感信息的泄露已成为数据挖掘和信息安全领域当前面临的重大挑战,隐私保护的数据挖掘(Privacy Preserving Data Mining,PPDM)也已经成为数据挖掘(DM)领域的一个重要研究课题。聚类挖掘和关联规则挖掘是应用较为广泛的数据挖掘方法。本文针对垂直分布环境下聚类挖掘和关联规则挖掘的隐私保护方法进行研究,目的是在有效地挖掘出数据库中隐藏的知识的同时保护数据的隐私。本文从敏感知识的保护和敏感数据的保护两方面,介绍了数据挖掘中的常用隐私保护技术;在阐述了数据挖掘技术的基础上,重点介绍了聚类挖掘和关联规则挖掘的原理和流行算法,并分析了各种算法的优缺点。在此基础上,针对数据垂直分布的聚类挖掘和关联规则挖掘中的敏感知识的保护进一步做了以下工作:(1)对于聚类挖掘的隐私保护,设计了一种新的基于数据垂直分布的隐私保护的聚类算法VPPDK(Vertically Partitioned Data Oriented Privacy Preserving Distributed K-means),该算法在数据垂直分布的条件下,将数据干扰和安全多方计算相结合,利用半可信第三方参与下的安全求平均值协议,实现了隐私保护的聚类挖掘,不仅能达到保护数据隐私安全的要求,而且能得到有效的挖掘结果。(2)对于关联规则挖掘的隐私保护,设计了一种新的针对关联规则挖掘的基于密码学技术的隐私保护策略CRYPPARM(Cryptology Based Strategy for Privacy PreservingAssociation Rule Mining)。在CRYPPARM中,采用了安全两方点积协议和公钥密码体系来对垂直分布的数据进行有效的挖掘。同时还引入了局部拓扑结构来尽可能地降低通信成本。(3)对文中设计的相关算法做了测试实验,实验结果表明这些算法具有较好的挖掘准确性、隐私保护性和效率。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 课题研究的意义
  • 1.2 本文所做的工作
  • 1.3 本文内容的组织
  • 第二章 数据挖掘原理与算法分析
  • 2.1 数据挖掘
  • 2.1.1 数据挖掘的演化历史
  • 2.1.2 数据挖掘的基本概念
  • 2.1.3 数据挖掘环境
  • 2.1.4 数据挖掘的基本过程
  • 2.1.5 分布式数据挖掘
  • 2.2 聚类挖掘
  • 2.2.1 聚类挖掘基本概念
  • 2.2.2 聚类挖掘算法分析
  • 2.3 关联规则挖掘
  • 2.3.1 关联规则基本概念
  • 2.3.2 关联规则算法描述
  • 2.4 本章小结
  • 第三章 隐私保护的数据挖掘技术与方法分析
  • 3.1 数据挖掘中的隐私保护
  • 3.1.1 隐私的定义与分类
  • 3.1.2 隐私保护与隐私的度量
  • 3.1.3 隐私保护技术的分类
  • 3.1.4 隐私保护的性能评估
  • 3.2 主要的隐私保护技术分析
  • 3.2.1 数据干扰技术
  • 3.2.2 安全多方计算
  • 3.2.3 同态加密
  • 3.3 本章小结
  • 第四章 垂直分布下隐私保护的聚类挖掘算法研究
  • 4.1 问题描述及相关技术
  • 4.1.1 分布式聚类
  • 4.1.2 K-means 算法描述
  • 4.1.3 安全多方求平均值协议
  • 4.2 数据垂直分布的隐私保护的 K-means 聚类算法 VPPDK 的设计
  • 4.2.1 设计思想
  • 4.2.2 算法描述
  • 4.3 实验与性能分析
  • 4.3.1 安全性分析
  • 4.3.2 聚类精度测试与分析
  • 4.3.3 效率测试与分析
  • 4.4 本章小结
  • 第五章 垂直分布下隐私保护的关联规则挖掘算法研究
  • 5.1 问题描述
  • 5.2 安全点积协议与公钥密码体制
  • 5.2.1 安全点积协议
  • 5.2.2 公钥密码体制
  • 5.3 新的针对关联规则挖掘的基于密码学技术的隐私保护策略
  • 5.3.1 隐私保护算法
  • 5.3.2 数据模型
  • 5.3.3 局部拓扑
  • 5.3.4 支持度的计算
  • 5.3.5 关联规则的生成
  • 5.3.6 主要过程
  • 5.4 实验与性能分析
  • 5.4.1 安全性分析
  • 5.4.2 记录数对性能影响的测试与结果分析
  • 5.4.3 密钥长度对性能影响的测试与结果分析
  • 5.5 本章小结
  • 第六章 结束语
  • 缩略词
  • 图表清单
  • 致谢
  • 参考文献
  • 攻读硕士学位期间的学术论文和科研情况
  • 相关论文文献

    • [1].中小银行数据挖掘思路浅析[J]. 金融电子化 2020(05)
    • [2].计算机数据挖掘在互联网行业中的应用[J]. 电子技术与软件工程 2018(23)
    • [3].大数据下一种规则的快速挖掘技术研究[J]. 河南科技 2018(25)
    • [4].大数据时代的数据挖掘综述[J]. 价值工程 2019(05)
    • [5].数据挖掘在农业信息化中的应用进展探析[J]. 信息记录材料 2019(01)
    • [6].恰当的水务大数据才符合数据挖掘的需求[J]. 城乡建设 2019(02)
    • [7].数据挖掘构成要素的侦查视角分析[J]. 河南警察学院学报 2019(02)
    • [8].远距离光纤通信传输故障数据挖掘方法[J]. 激光杂志 2019(04)
    • [9].数据挖掘的研究热点和发展趋势的浅谈[J]. 电脑知识与技术 2019(08)
    • [10].大数据挖掘在电商市场中分析与决策的应用[J]. 电子技术与软件工程 2019(07)
    • [11].浅谈计算机数据挖掘技术的开发及应用探究[J]. 信息技术与信息化 2019(05)
    • [12].数据挖掘在计算机实验室管理系统中的应用[J]. 数字通信世界 2019(09)
    • [13].大数据挖掘在高校智慧校园建设中的应用分析[J]. 信息系统工程 2019(08)
    • [14].数据挖掘概述[J]. 中外企业家 2019(33)
    • [15].大数据时代数据挖掘在银行的应用[J]. 计算机产品与流通 2019(10)
    • [16].浅谈新时期数据挖掘的运用[J]. 电脑知识与技术 2019(25)
    • [17].基于数据挖掘探讨中医药治疗类风湿性关节炎的用药规律[J]. 浙江中医杂志 2019(10)
    • [18].数据挖掘视域下高校构建智慧校园的创新路径[J]. 信息通信 2019(09)
    • [19].互联网行业中计算机数据挖掘的应用分析[J]. 佳木斯职业学院学报 2019(12)
    • [20].基于网络教学的教育数据挖掘基本算法研究[J]. 电脑知识与技术 2019(28)
    • [21].数据挖掘在电力调度自动化系统中的应用解析[J]. 科技创新与应用 2017(35)
    • [22].浅析数据挖掘在审计中的应用[J]. 现代经济信息 2017(22)
    • [23].云计算和挖掘服务融合下的大数据挖掘体系架构设计及应用[J]. 电脑编程技巧与维护 2017(24)
    • [24].试论数据挖掘在电力调度自动化系统中的应用[J]. 科技创新与应用 2018(04)
    • [25].大数据挖掘及应用[J]. 科技与出版 2017(11)
    • [26].基于R语言的大数据挖掘课程建设研究[J]. 无线互联科技 2018(04)
    • [27].2018年《计算机研究与发展》专题(正刊)征文通知——数据挖掘前沿进展[J]. 计算机研究与发展 2018(02)
    • [28].软件工程行业中数据挖掘的应用探讨[J]. 中国新通信 2018(05)
    • [29].健康大数据挖掘方法研究综述[J]. 软件导刊 2018(03)
    • [30].数据挖掘在金融行业的应用探究[J]. 信息通信 2018(02)

    标签:;  ;  ;  ;  

    数据垂直分布的隐私保护数据挖掘算法研究
    下载Doc文档

    猜你喜欢