数据挖掘功能组件的设计与实现

数据挖掘功能组件的设计与实现

论文摘要

数据挖掘是信息科学及其应用中一个非常有前景的发展方向。数据挖掘,也叫做知识发现,用于提取蕴涵于大型数据库、数据仓库、互联网、其它数据源、以及数据流中的代表有用知识的模式。如今,以爆炸性速度增长的数据使得人们迫切需要一种自动化的数据挖掘工具用于将大量数据转变为有价值的信息和知识。DM2是一款由我们自行设计并开发的数据挖掘平台,该平台的设计目标是为了服务于中小型的数据挖掘项目。DM2平台不仅支持当今主流的数据库产品,如Oracle、MySQL、SQLServer等,而且还与著名的数据挖掘实验平台Weka相兼容。目前,我们已经完成了平台核心结构的设计和开发,并在其基础上实现了ID3、Naive Bayes、FP-Growth、Closet等数据挖掘算法。这篇文章主要介绍了DM2平台的详细设计思想,包括数据类型的设计,与数据库交互的方法,以及一些挖掘算法的基本原理等,同时本文还介绍了我们利用DM2平台在铁路货票数据上所进行的数据挖掘实验。

论文目录

  • 致谢
  • 中文摘要
  • ABSTRACT
  • 1 引言
  • 1.1 数据挖掘概述
  • 1.2 主要工作和论文的组织
  • 2 通用数据挖掘平台DM2
  • 2.1 DM2平台介绍
  • 2.2 数据挖掘中的数据类型
  • 2.3 实例和实例集
  • 2.4 DM2中的属性
  • 2.5 DM2中的实例与实例集
  • 2.6 数据库实例集
  • 2.6.1 结合数据挖掘系统与数据库系统
  • 2.6.2 Hibernate简介
  • 2.6.3 数据类型的转换
  • 2.6.4 实例的载入和存储
  • 2.6.5 选择与挖掘任务相关的数据
  • 2.7 数据挖掘模型
  • 2.8 本章小结
  • 3 利用DM2平台挖掘关联规则
  • 3.1 关联分析简介
  • 3.2 从实例集到频繁项集再到关联规则
  • 3.3 使用CLOSET算法挖掘关联规则
  • 3.3.1 CLOSET算法
  • 3.3.2 从闭频繁项集生成所有关联规则
  • 3.4 挖掘指定格式的关联规则
  • 3.5 本章小结
  • 4 铁路货票数据挖掘
  • 4.1 铁路货票数据集
  • 4.2 货票挖掘表的构成
  • 4.3 DM2货票挖掘实验系统
  • 4.4 挖掘实验
  • 5 结论
  • 参考文献
  • 索引
  • 作者简历
  • 学位论文数据集
  • 相关论文文献

    • [1].基于频繁项集挖掘的零售医药企业药品关联研究[J]. 重庆科技学院学报(自然科学版) 2019(06)
    • [2].基于差异节点集的加权频繁项集挖掘算法[J]. 计算机工程 2020(05)
    • [3].基于强化学习的大数据频繁项集挖掘算法[J]. 信息通信 2020(06)
    • [4].浅谈加权频繁项集挖掘的研究进展[J]. 电脑知识与技术 2019(27)
    • [5].频繁项集挖掘的研究进展及主流方法[J]. 计算机科学 2018(S2)
    • [6].不确定数据中的代表频繁项集近似挖掘[J]. 计算机与数字工程 2017(02)
    • [7].基于频繁项集挖掘算法的伴随车应用与实现[J]. 计算机应用与软件 2017(04)
    • [8].基于渐近取样的频繁项集挖掘近似算法[J]. 控制工程 2017(09)
    • [9].一种利用差集的加权频繁项集挖掘算法[J]. 辽宁工程技术大学学报(自然科学版) 2016(03)
    • [10].基于差分隐私的频繁项集挖掘研究综述[J]. 电子技术与软件工程 2016(03)
    • [11].挖掘完全频繁项集的蚁群算法[J]. 微电子学与计算机 2014(12)
    • [12].大数据环境下频繁项集挖掘的研究[J]. 青岛科技大学学报(自然科学版) 2015(02)
    • [13].基于K均值聚类的大数据频繁项集挖掘研究[J]. 计算机仿真 2020(08)
    • [14].基于动态数据的加权频繁项集挖掘算法[J]. 科学技术与工程 2019(20)
    • [15].基于强化学习的大数据频繁项集挖掘算法[J]. 计算机工程与设计 2019(08)
    • [16].大数据环境下基于前缀树的频繁项集挖掘[J]. 控制工程 2019(11)
    • [17].一种高效的改进频繁项集挖掘算法[J]. 微电子学与计算机 2018(02)
    • [18].关联规则频繁项集挖掘算法设计与实现[J]. 特区经济 2018(08)
    • [19].基于概率模型的概率频繁项集挖掘方法[J]. 安阳师范学院学报 2017(02)
    • [20].基于二叉树的并行频繁项集挖掘算法[J]. 计算机技术与发展 2015(10)
    • [21].分布式频繁项集挖掘算法[J]. 计算机应用与软件 2015(10)
    • [22].基于闭频繁项集挖掘的技术演化研究方法[J]. 图书情报工作 2013(19)
    • [23].不确定数据频繁项集挖掘方法探析[J]. 莆田学院学报 2014(02)
    • [24].一种基于多核微机的闭频繁项集挖掘算法[J]. 计算机应用与软件 2013(03)
    • [25].基于改进倒排表和集合的最频繁项集挖掘算法[J]. 计算机应用研究 2012(06)
    • [26].一种分布式全局频繁项集挖掘方法[J]. 计算机工程与应用 2011(29)
    • [27].一种有效的负频繁项集挖掘方法[J]. 山东轻工业学院学报(自然科学版) 2011(04)
    • [28].一种改进的加权频繁项集挖掘算法[J]. 计算机工程与应用 2010(23)
    • [29].入侵检测中加权频繁项集挖掘[J]. 计算机工程与设计 2008(08)
    • [30].一种新的动态频繁项集挖掘方法[J]. 计算机工程与应用 2008(21)

    标签:;  ;  ;  ;  

    数据挖掘功能组件的设计与实现
    下载Doc文档

    猜你喜欢