基于扩展预测模型标记语言的数据流挖掘系统建模研究

基于扩展预测模型标记语言的数据流挖掘系统建模研究

论文摘要

数据流挖掘是近年智能数据分析发展的一个新的研究阶段,与传统静态数据挖掘不同,数据流呈现的特征给数据挖掘提出了新的挑战。当前数据流挖掘研究的一个困境是虽然出现了大量高效的数据流挖掘算法,但缺乏有效的数据流挖掘系统合理利用这些算法。如何构建高效、快速和智能的数据流挖掘系统是数据流挖掘研究迫切需要解决的一个问题。为解决这一问题,本文从系统建模的角度提出一种扩展语义的预测模型标记语言,并研究其怎样应用于数据流挖掘系统的构建。首先,提出了一种扩展预测模型标记语言EPMML作为面向数据流挖掘系统构建的建模语言。论文针对目前数据挖掘的元数据标准预测模型标记语言PMML存在语言元素众多并且缺乏语义描述功能的缺点,在描述逻辑的基础上,开发了一种扩展语义的预测模型标记语言EPMML。设计了EPMML语言的逻辑基础——描述逻辑DL4PMML,分析了EPMML的体系结构和语言要素,证明了EPMML语言的可判定性,分析了EPMML语言的推理复杂性。其次,提出了数据流挖掘系统的元数据体系结构,并分析了基于EPMML的数据流挖掘系统元数据。从知识表示功能的角度,分析了怎样使用EPMML进行知识表示;从EPMML具有知识推理功能的角度,设计基于EPMML的数据流挖掘元数据一致性检测框架,验证了EPMML支持知识推理的正确性和有效性,并给出了示例来演示基于EPMML语言的知识推理和语义一致性检测。再次,提出了数据流挖掘系统的数据建模理论,并分析了EPMML语言在数据流挖掘系统数据管理中的应用。论文建立面向数据流挖掘的形式化数据建模理论,诠释流式数据集上的规则提取与知识发现。提出了数据流的数据模型,分析了流式数据集上概念的内涵和外延,阐述了数据流中规则提取和概念迁移的本质。从构建数据流挖掘系统的数据组件的角度,分析了EPMML语言怎样建模数据组件,并通过具体的示例演示EPMML语言对数据组件的描述以及关联规则的提取过程。然后,提出了数据流挖掘系统的算法管理模型,解决了目前数据流挖掘研究算法众多但利用率低的问题,并分析了EPMML语言在数据流挖掘系统算法管理中的应用。在算法组件中,将数据流挖掘的算法作为语义Web服务,结合EPMML语言,提出了面向数据流挖掘系统的算法管理框架AMF-DSMS。分析了怎样应用EPMML语言描述算法服务,设计了基于EPMML的算法服务接口。通过一个具体的示例说明框架AMF-DSMS的有效性。最后,设计了数据流挖掘系统的整体框架,阐述了各个组件和模块的功能,分析了框架对于数据流特征的适应性,给出了系统框架的行为语义,设计了数据流挖掘系统的建模层次结构,综合分析了基于EPMML的数据流挖掘元数据在系统中的作用。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 问题的提出
  • 1.1.1 数据流挖掘的过程
  • 1.1.2 数据流挖掘系统研究的紧迫性
  • 1.1.3 数据流挖掘系统的元数据和元建模
  • 1.2 国内外相关研究现状
  • 1.2.1 数据流挖掘技术的发展
  • 1.2.2 数据流挖掘系统的历史发展和现状
  • 1.2.3 数据挖掘元数据和元模型的研究现状
  • 1.3 本文的主要研究工作
  • 1.4 本文的组织结构
  • 第二章 一种扩展的预测模型标记语言EPMML
  • 2.1 引言
  • 2.2 预测模型标记语言PMML
  • 2.2.1 面向数据挖掘的PMML 语言
  • 2.2.2 PMML 语言的缺陷
  • 2.3 语义WEB 的逻辑学基础
  • 2.3.1 语义Web
  • 2.3.2 描述逻辑家族
  • 2.3.3 基于描述逻辑设计EPMML 语言的理念
  • 2.4 描述逻辑DL4PMML
  • 2.5 扩展预测模型标记语言EPMML
  • 2.5.1 EPMML 元类
  • 2.5.2 EPMML 复杂元类
  • 2.5.3 EPMML 属性
  • 2.5.4 EPMML 个体
  • 2.5.5 EPMML 属性约束
  • 2.5.6 EPMML 辅助语言元素
  • 2.6 EPMML 与OWL 的比较
  • 2.7 本章小结
  • 第三章 基于EPMML 的数据流挖掘系统元数据分析与验证
  • 3.1 引言
  • 3.2 数据流挖掘系统元数据
  • 3.3 基于EPMML 的知识表示
  • 3.4 基于EPMML 的知识推理
  • 3.4.1 DL4PMML 的推理复杂性
  • 3.4.2 EPMML 元数据一致性检测框架
  • 3.5 知识推理和一致性检测示例
  • 3.5.1 语义一致性示例
  • 3.5.2 冲突检测示例
  • 3.6 本章小结
  • 第四章 基于EPMML 的数据流挖掘系统的数据组件建模
  • 4.1 引言
  • 4.2 数据流挖掘的形式化数据模型
  • 4.2.1 流式数据的信息系统模型
  • 4.2.2 面向数据流挖掘的决策逻辑语言
  • 4.2.3 概念的内涵和外延
  • 4.2.4 概念迁移的实质
  • 4.3 数据流上规则提取的解释
  • 4.3.1 规则的质量度量
  • 4.3.2 关联规则的解释
  • 4.3.3 决策规则的解释
  • 4.4 数据流挖掘系统数据组件的建模
  • 4.5 示例演示与分析
  • 4.6 本章小结
  • 第五章 基于EPMML 的数据流挖掘系统的算法组件建模
  • 5.1 引言
  • 5.2 数据流挖掘系统算法管理框架
  • 5.2.1 框架的设计原则
  • 5.2.2 AMF-DSMS 框架的描述
  • 5.2.3 AMF-DSMS 的执行语义
  • 5.3 基于EPMML 的算法管理组件建模
  • 5.3.1 基于EPMML 的算法服务描述
  • 5.3.2 基于EPMML 的算法接口设计
  • 5.4 示例演示与分析
  • 5.4.1 算法选择的必要性
  • 5.4.2 算法选择与优化
  • 5.5 本章小结
  • 第六章 数据流挖掘系统框架的设计
  • 6.1 引言
  • 6.2 系统框架的整体设计
  • 6.3 系统框架对流式数据的适应性
  • 6.4 系统框架的行为设计
  • 6.5 数据流挖掘系统的建模层次结构
  • 6.6 系统中的EPMML 元数据
  • 6.7 本章小结
  • 第七章 结束语
  • 7.1 总结和本文贡献
  • 7.2 关于数据流挖掘系统建模的思考
  • 7.3 未来工作
  • 参考文献
  • 致谢
  • 在学期间的科研成果及发表的学术论文
  • 附录
  • 附录1:基于EPMML 的关联规则模型
  • 附录2:数据流挖掘算法V-STREAM
  • 相关论文文献

    • [1].基于数据流挖掘的网络边界防护技术研究[J]. 计算机与数字工程 2016(07)
    • [2].数据流挖掘中的聚类技术[J]. 衡水学院学报 2015(01)
    • [3].数据流挖掘技术研究[J]. 洛阳师范学院学报 2014(02)
    • [4].基于数据流挖掘的教育公共服务平台建设研究——以移动环境为视角[J]. 职业技术 2014(09)
    • [5].基于动态数据流挖掘的案例推理及其应用[J]. 计算机工程与应用 2011(19)
    • [6].面向数据流挖掘过程的算法管理框架[J]. 应用科学学报 2008(01)
    • [7].基于支持向量数据描述的分布式数据流挖掘[J]. 计算机工程 2012(18)
    • [8].数据流挖掘的关键问题研究[J]. 煤炭技术 2010(12)
    • [9].面向林业物联网的海量时空数据流挖掘关键问题研究[J]. 物联网技术 2016(07)
    • [10].数据流挖掘研究及其进展[J]. 小型微型计算机系统 2008(12)
    • [11].数据流挖掘抑制概念漂移不良影响研究[J]. 软件导刊 2018(09)
    • [12].数据流挖掘技术研究[J]. 佛山科学技术学院学报(自然科学版) 2014(04)
    • [13].传感器网络分布式数据流挖掘研究综述[J]. 广西经济管理干部学院学报 2015(04)
    • [14].自适应模糊决策树算法在数据流挖掘中的应用[J]. 现代电子技术 2010(10)
    • [15].数据流分类研究综述[J]. 科技信息 2012(22)
    • [16].一种基于图的数据流关联规则挖掘算法[J]. 通化师范学院学报 2018(02)
    • [17].基于Web数据流挖掘的增值服务平台设计[J]. 河南科学 2010(06)
    • [18].农业物联网中数据流挖掘技术的应用论述[J]. 南方农业 2015(24)
    • [19].大数据背景下的数据流挖掘技术[J]. 中国科技信息 2014(16)
    • [20].面向android手机平台的网络恶意数据流挖掘研究[J]. 科学技术与工程 2016(33)
    • [21].一种高效的基于排序二叉树的数据流挖掘算法[J]. 计算机工程与科学 2008(11)
    • [22].大数据驱动的反恐情报决策体系构建[J]. 情报杂志 2018(10)
    • [23].大数据(3)[J]. 中兴通讯技术 2013(03)
    • [24].大数据[J]. 中兴通讯技术 2013(01)
    • [25].面向航天器综合测试系统的Web缓存替换策略[J]. 北京航空航天大学学报 2018(08)
    • [26].基于数据流挖掘的油水井工况分析系统的设计与应用[J]. 山东工业技术 2019(03)
    • [27].大数据(2)[J]. 中兴通讯技术 2013(02)
    • [28].一种高效的基于数据流模型的电力系统实时安全评估算法[J]. 中小企业管理与科技(下旬刊) 2012(04)
    • [29].基于多元索引后继树的时间序列数据流挖掘[J]. 计算机工程与科学 2011(06)
    • [30].基于定量更新滑动窗口频繁闭项集挖掘算法研究[J]. 软件 2012(12)

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

    基于扩展预测模型标记语言的数据流挖掘系统建模研究
    下载Doc文档

    猜你喜欢