数据挖掘工作流的发现和复用

数据挖掘工作流的发现和复用

论文摘要

由于数据挖掘模式的多样性、挖掘过程的非平凡性、挖掘算法的复杂性,使得构造一个完整的知识发现流程往往是耗时的,而且需要领域专家和算法设计人员的多方参与。这些流程不仅可以揭示知识发现过程,而且含有针对某类具有共性问题的解决方案。因此,如果能够对这些工作流进行发现和复用的话,可以大大缩短工作流的创建时间,提高工作流的创建质量。在本文中,我们利用本体论的方法实现了一个数据挖掘工作流发现和复用系统。主要工作包括:1、根据用户的需求和数据挖掘工作流的特点,提出了数据挖掘工作流的四层描述模型:1)自然语言描述;2)将工作流当作一个原子服务来描述;3)将工作流当作一个组合服务来描述;4)对工作流的结构进行描述。2、根据这个四层描述模型,建立了知识发现领域的本体,在本体中确定了数据挖掘领域的类,关系,公理,再利用它们对工作流资源进行组织。并利用OWL语言实现了该本体。3、提出了工作流查询的体系结构,由以下四个部分组成:图形化用户界面,查询处理模块,关键字查询模块,语义查询模块。在语义查询模块中,利用SPARQL语言实现了基于本体的语义查询。在数据挖掘工作流本体中,利用T-BOX中的推理来进行本体的维护,利用A-BOX的推理来回答用户的查询,在A-BOX中,我们实现了三种类型的推理:1)垂直推理;2)水平推理;3)新关系的推理。通过这些推理规则的引入,该系统就可以更好的支持用户的复杂查询,提高了搜索的查全率和查准率。4、实现了一个数据挖掘工作流发现和复用的原型系统,该系统采用三层体系结构,分别为:存储层,管理层和GUI层。这样可以让用户通过可视化界面来操作本体以进行数据挖掘工作流的查找,在该系统中,我们还提供了一些规范化的术语,以规范用户的输入来获得更准确的查询结果。现阶段,对于工作流设计的生命周期,系统支持工作流的查找,编辑和运行,但是还不能够支持工作流的发布。系统还不提供工作流的关键字查找。这两个问题将是我们下一步的研究工作。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现况
  • 1.3 研究内容
  • 1.4 论文的结构
  • 第二章 相关技术综述
  • 2.1 数据挖掘
  • 2.1.1 数据挖掘的任务
  • 2.1.2 数据挖掘的过程
  • 2.1.3 数据挖掘的方法
  • 2.2 网格计算
  • 2.3 工作流技术
  • 2.3.1 工作流技术介绍
  • 2.3.2 工作流管理系统
  • 2.4 语义网和本体
  • 第三章 基于网格的数据挖掘环境
  • 3.1 网格基础环境
  • 3.1.1 Globus 项目介绍
  • 3.1.2 项目的组件构成
  • 3.2 工作流的设计
  • 3.2.1 工作流设计的生命周期
  • 3.2.2 工作流的发现和复用
  • 第四章 数据挖掘工作流本体的设计
  • 4.1 工作流的描述模型
  • 4.1.1 工作流发现的需求
  • 4.1.2 描述模型应具有的特性
  • 4.1.3 工作流的四层描述模型
  • 4.2 工作流的本体
  • 4.2.1 工作流本体的建立
  • 4.2.2 工作流本体的实现
  • 第五章 基于本体的查询和推理
  • 5.1 基于本体的查询
  • 5.1.1 语义查询的体系结构
  • 5.1.2 资源模型介绍
  • 5.1.3 通过SPARQL 实现查询
  • 5.2 本体中的推理
  • 5.2.1 基于描述逻辑的推理机制
  • 5.2.2 OWL 语言与描述逻辑
  • 5.2.3 数据挖掘工作流的DL 描述
  • 5.2.4 基于OWL DL 的推理
  • 第六章 原型系统实现
  • 6.1 原型系统体系结构
  • 6.2 原型系统功能介绍
  • 第七章 总结与展望
  • 7.1 论文总结
  • 7.2 展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [2].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [3].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [4].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [5].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [6].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [7].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [8].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [9].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [10].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [11].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [12].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [13].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [14].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [15].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [16].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [17].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [18].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [19].浅析数据挖掘[J]. 内江科技 2020(06)
    • [20].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [21].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [22].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [23].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [24].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [25].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [26].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [27].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [28].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [29].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)
    • [30].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(10)

    标签:;  ;  ;  ;  ;  ;  

    数据挖掘工作流的发现和复用
    下载Doc文档

    猜你喜欢