基于抽样的隐私保护聚类挖掘算法研究

基于抽样的隐私保护聚类挖掘算法研究

论文摘要

数据分析与处理技术迅速发展,在公布或共享数据以挖掘有效决策信息和知识的同时,不免暴露出个人和公司隐私泄露问题,进而催生了隐私保护数据挖掘这一研究领域并在近三年成为国内外研究者关注的焦点。数据挖掘中的聚类挖掘是分析管理问题的重要方法之一,常应用于市场细分、客户分类与制造系统单元化设计等重要领域,而要得到这些结果则需要涉及大量详细具体的敏感性数据和信息,与此同时数据中潜在的模式和规律也很有可能对隐私和信息安全构成威胁。因此随着客户个性化需求时代的急速发展,聚类隐私保护算法也成为亟待解决的关键隐私保护数据挖掘问题。目前关于隐私保护聚类挖掘算法才刚刚起步,采用的隐私保护算法也相对简单,且现有的隐私保护聚类算法在效率效果上均存在着难以调和的矛盾。基于这种现状,本文提出了抽样隐私保护聚类算法,在保证数据隐私性和聚类结果准确性的同时,还可以处理大规模数据。论文主要贡献在于依据基于密度和基于模型聚类算法可构建聚类分布函数的原理,构造了均匀抽样、一元正态和多元正态抽样等三种聚类分布函数。并指出加和模糊系统与高斯混合函数的等价性,确立了基于模糊C均值聚类统计结果的分布函数参数的最优估计,进而应用随机抽样技术,产生了既具原始数据聚类特征又能保护隐私的新数据,并给出了算法流程的详细描述。最后通过仿真实验,验证了本文算法的有效性,并给出了各种隐私保护聚类方法的优势和适用条件。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章引言
  • §1-1 问题提出
  • §1-2 研究思路与论文结构
  • 第二章隐私保护聚类挖掘算法综述
  • §2-1 算法分类
  • §2-2 算法机理
  • 2-2-1 基于几何集的数据转换方法
  • 2-2-2 基于旋转的数据转换方法
  • 2-2-3 基于随机映射的数据转换方法
  • 2-2-4 基于主成分分析的数据转化方法
  • 2-2-5 算法参数总结
  • §2-3 算法评价
  • 2-3-1 隐私保护度
  • 2-3-2 聚类结果准确性
  • 2-3-3 计算成本和可扩展性
  • 本章小结
  • 第三章基于抽样的隐私保护聚类挖掘算法设计
  • §3-1 聚类挖掘算法分析
  • §3-2 聚类密度分布函数建立
  • 3-2-1 基于密度聚类算法的影响函数模型
  • 3-2-2 基于EM聚类算法的有限高斯混合函数模型
  • §3-3 聚类密度分布函数参数确定
  • 3-3-1 极大似然函数
  • 3-3-2 模糊K均值聚类
  • 3-3-3 模型参数的确定
  • §3-4 抽样方法选择
  • §3-5 基于抽样的隐私保护聚类算法描述
  • 本章小结
  • 第四章隐私保护聚类挖掘算法仿真分析
  • §4-1 实验设计
  • 4-1-1 实验目的
  • 4-1-2 实验环境
  • 4-1-3 实验数据
  • §4-2 实验结果
  • §4-3 实验分析
  • 本章小结
  • 第五章结论
  • 参考文献
  • 附录A
  • 致谢
  • 攻读学位期间所取得的相关科研成果
  • 相关论文文献

    • [1].基于用电侧大数据多维聚类挖掘的营销新增效果评估分析[J]. 现代信息科技 2019(22)
    • [2].用电侧大数据多维聚类挖掘营销策略与客户行为趋势分析模型建构[J]. 中国管理信息化 2020(07)
    • [3].云环境下基于群智能算法的大数据聚类挖掘技术[J]. 现代电子技术 2020(15)
    • [4].基于语义和领域相关的聚类挖掘方法研究[J]. 微计算机应用 2008(11)
    • [5].银行卡客户群体聚类挖掘研究[J]. 微计算机信息 2008(30)
    • [6].基于多维聚类挖掘的异常检测方法研究[J]. 计算机技术与发展 2012(07)
    • [7].基于特征选择的混合属性数据聚类挖掘仿真[J]. 计算机仿真 2020(07)
    • [8].云环境下基于群智能算法的大数据聚类挖掘技术[J]. 现代电子技术 2019(09)
    • [9].一种基于半监督的大数据集聚类挖掘算法[J]. 科技广场 2017(05)
    • [10].基于云聚类挖掘的物流信息智能分析方法研究[J]. 情报资料工作 2016(01)
    • [11].基于人工鱼群算法的聚类挖掘[J]. 计算机仿真 2009(02)
    • [12].社交网络时空大数据聚类挖掘有效选择分析[J]. 测绘地理信息 2020(02)
    • [13].面向聚类挖掘的个性化隐私保护算法[J]. 哈尔滨工程大学学报 2018(11)
    • [14].数据流聚类挖掘算法优化研究[J]. 曲阜师范大学学报(自然科学版) 2018(03)
    • [15].一种基于Hadoop云计算平台大数据聚类算法设计[J]. 通化师范学院学报 2016(04)
    • [16].多尺度聚类挖掘算法[J]. 计算机科学 2016(08)
    • [17].基于路网的LBSN用户移动轨迹聚类挖掘方法[J]. 计算机应用研究 2013(08)
    • [18].基于因果行为轮廓的流程变体聚类挖掘方法[J]. 计算机集成制造系统 2020(06)
    • [19].基于数据挖掘技术的现代图书馆系统设计[J]. 图书馆学刊 2013(02)
    • [20].基于聚类挖掘的安全阀试验位移数据处理[J]. 煤矿开采 2011(05)
    • [21].基于医疗数据的聚类挖掘策略研究[J]. 计算机技术与发展 2020(07)
    • [22].一种基于局部密度的分布式聚类挖掘算法[J]. 软件学报 2008(09)
    • [23].基于大数据的分布式隐私保护聚类挖掘算法研究[J]. 智能计算机与应用 2018(06)
    • [24].基于密度与动态阈值的任意形状聚类挖掘算法研究[J]. 电信科学 2012(01)
    • [25].一种新的属性图重叠聚类挖掘算法[J]. 智能计算机与应用 2012(05)
    • [26].云计算中基于群体智能算法的大数据聚类挖掘[J]. 重庆理工大学学报(自然科学) 2019(04)
    • [27].一种基于Hadoop云计算平台大数据聚类算法设计[J]. 楚雄师范学院学报 2016(03)
    • [28].面向聚类挖掘的局部旋转扰动隐私保护算法[J]. 广东工业大学学报 2012(03)
    • [29].基于数据流聚类挖掘算法的入侵检测系统研究[J]. 信阳农林学院学报 2020(03)
    • [30].面向隐私保护聚类的平面反射数据扰动方法[J]. 计算机工程与应用 2013(06)

    标签:;  ;  ;  ;  

    基于抽样的隐私保护聚类挖掘算法研究
    下载Doc文档

    猜你喜欢