基于压缩数据的数据挖掘算法的研究

基于压缩数据的数据挖掘算法的研究

论文摘要

数据压缩技术可以提高海量数据的存储效率,改善数据库整体性能。数据挖掘则是为了满足人们对数据中所蕴涵的信息和知识的充分理解和应用而发展起来的一门新兴技术。近年来,人们在数据挖掘领域做了大量研究,但是对基于压缩数据的数据挖掘技术的研究还相当少,因此研究适用于压缩数据的数据挖掘算法具有重要的理论价值和实际意义。本文主要研究基于压缩数据的关联规则挖掘、分类挖掘和聚类挖掘算法。首先,提出了数据库压缩算法H_ItCompress,该算法充分考虑初始代表元组集的选择,并且采用一个压缩数据元组对应多个代表元组的策略,获得了比同类算法更好的压缩效果。其次,提出了基于压缩数据的关联规则挖掘算法C_ SPARMing和分类挖掘算法CMSA_CBA。这两个算法可应用于经过H_ItCompress等基于代表元组集的一类压缩算法压缩后的数据库。算法直接在压缩数据上进行挖掘操作,具有执行效率高和较好的可伸缩性。再次,提出了基于压缩数据的聚类挖掘算法CCMD_P,本算法对压缩的多维数据集合进行聚类挖掘,适用于所有映射完全的数据压缩方法。由于算法直接对压缩数据聚类,并且结合了划分聚类和层次聚类的优点,不但可以得到非球型的簇,而且具有较高的效率和较好的可伸缩性。最后,本文基于以上算法,实现了一个基于压缩数据的数据挖掘原型系统。

论文目录

  • 中文摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 压缩技术研究现状
  • 1.2.2 数据挖掘技术研究现状
  • 1.2.3 基于压缩数据的数据挖掘技术研究现状
  • 1.3 本文的贡献
  • 1.4 论文的结构
  • ItCompress'>第2章 数据库压缩算法HItCompress
  • 2.1 引言
  • 2.1.1 基本概念
  • 2.1.2 ItCompress 算法
  • ItCompress 算法'>2.2 HItCompress 算法
  • ItCompress 算法描述'>2.2.1 HItCompress 算法描述
  • 2.2.2 算法复杂性分析
  • 2.3 实验结果及性能分析
  • 2.4 本章小节
  • 第3章 基于压缩数据的关联规则挖掘算法
  • 3.1 引言
  • SPARMing'>3.2 压缩数据集上的关联规则挖掘算法 CSPARMing
  • 3.2.1 完全项集前缀树
  • SPARMing 算法描述'>3.2.2 CSPARMing 算法描述
  • 3.2.3 算法复杂性分析
  • 3.3 实验结果及性能分析
  • 3.4 本章小节
  • 第4章 基于压缩数据的分类挖掘算法
  • 4.1 引言
  • CBA'>4.2 压缩数据集上的分类挖掘算法CMSACBA
  • 4.2.1 挖掘类关联规则
  • 4.2.2 修剪类关联规则以构造简单而精确的分类器
  • 4.2.3 利用分类器预测数据实例的类别
  • 4.2.4 算法复杂性分析
  • 4.3 实验结果及性能分析
  • 4.4 本章小节
  • 第5章 基于压缩数据的聚类挖掘算法
  • 5.1 引言
  • 5.1.1 聚类分析的数据结构
  • 5.1.2 聚类分析中的数据类型
  • P'>5.2 压缩数据集上的聚类挖掘算法CCMDP
  • 5.2.1 压缩多维数据集
  • P 算法'>5.2.2 CCMDP算法
  • 5.2.3 算法复杂性分析
  • 5.3 实验结果及性能分析
  • 5.4 本章小结
  • 第6章 基于压缩数据的数据挖掘原型系统
  • 6.1 CMining 系统体系结构
  • 6.2 CMining 系统功能
  • 6.3 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].Lempel-Ziv-Welch压缩数据的误码纠正[J]. 电子与信息学报 2020(06)
    • [2].计算机网络传输中有效压缩数据的方法研究[J]. 通讯世界 2016(15)
    • [3].浅析如何在计算机网络传输中有效地压缩数据[J]. 电脑知识与技术 2015(14)
    • [4].冗余字典的扰动压缩数据分离[J]. 西南大学学报(自然科学版) 2015(09)
    • [5].基于优化字典学习算法的压缩数据收集[J]. 北京航空航天大学学报 2016(06)
    • [6].基于非凸极小化的扰动压缩数据分离[J]. 电子学报 2017(01)
    • [7].超大型压缩数据仓库的查询研究[J]. 计算机与现代化 2009(06)
    • [8].Lempel-Ziv-Welch(LZW)压缩数据误码修复技术[J]. 北京理工大学学报 2020(05)
    • [9].浅析大数据时代的计算机信息处理技术[J]. 通讯世界 2020(02)
    • [10].应用偶极压缩数据确定地下隐蔽构造性质的方法(英文)[J]. 国外测井技术 2016(03)
    • [11].时域压缩特征提取及压缩感知在设备状态评估中的应用研究[J]. 机械科学与技术 2017(10)
    • [12].MR-DC:基于MapReduce的轻量级数据压缩策略[J]. 智能计算机与应用 2015(01)
    • [13].压缩数据节省手机流量[J]. 电脑爱好者 2016(14)
    • [14].压缩数据上的关系代数操作算法[J]. 计算机应用 2016(01)
    • [15].DDFS Sunderland算法的改进[J]. 微计算机信息 2009(12)
    • [16].移动GIS中GML数据压缩技术研究[J]. 地理与地理信息科学 2008(05)
    • [17].传感器网络中基于分布式压缩的数据聚合方法[J]. 数据采集与处理 2016(06)
    • [18].探空火箭箭载图像压缩系统设计与实现[J]. 计算机测量与控制 2013(11)
    • [19].基于ZEVIO 1020的JPEG解码设计与实现[J]. 应用科技 2008(11)
    • [20].压缩数据分离问题研究[J]. 科技风 2019(29)
    • [21].探析中学生数据处理能力的内涵[J]. 成都师范学院学报 2014(01)
    • [22].基于CS理论的一种雷达数据压缩方法[J]. 系统仿真学报 2014(04)
    • [23].服务牌打消投资顾虑[J]. 中国经济和信息化 2012(17)
    • [24].嵌入无损编码的海量视频数据存储系统设计[J]. 电视技术 2016(04)

    标签:;  ;  ;  ;  ;  

    基于压缩数据的数据挖掘算法的研究
    下载Doc文档

    猜你喜欢