一种可发现复杂循环结构的扩展α过程挖掘算法

一种可发现复杂循环结构的扩展α过程挖掘算法

论文摘要

过程挖掘通过分析企业应用系统所产生的事件日志信息,能够重现业务流程的真实执行过程,并利用所发现的知识对工作流模型进行优化和重构,是数据挖掘技术在工作流管理领域的一种较新应用。自从1998年IBM研究院Agrawal等研究员提出从事件日志中发现工作流结构模型的方法起,至今已涌现出许多过程挖掘的研究,而复杂循环结构的发现和处理是当前过程挖掘中的一个重点和难点问题。因此,研究基于事件日志的能够发现和处理复杂循环结构的过程挖掘算法,是未来研究的一个新的发展方向,对过程挖掘技术提出了新的挑战。本文在研究过程挖掘中经典α过程挖掘算法及其扩展算法基础之上,针对算法挖掘工作流模型中复杂循环结构能力不足的问题,根据工作流模型中循环结构与其它结构的不同嵌套情况,讨论并分析其在事件日志中的表现形式,并基于活动之间的因果依赖关系,提出启发式判定规则,给出一种具有发现和处理复杂循环结构能力的方法。通过给出包含事件日志中活动间的因果依赖关系及循环结构执行轨迹信息的递归定义,将复杂循环结构识别方法应用于a过程挖掘算法中,使其具有挖掘复杂循环结构的能力。该扩展α过程挖掘算法的思想是:识别出工作流模型中的最外层循环结构并使用虚拟任务进行代替,从而抽取出事件日志中的循环结构执行轨迹信息,应用a过程挖掘算法对不包含循环结构执行轨迹信息的日志进行挖掘得出流程主模型;然后分别对每个循环结构的内部模块进行挖掘,并将得出的子模型代替主模型中对应的虚拟任务;递归进行上述过程,对循环结构的执行轨迹信息进行挖掘,并将每个子模型代入主模型,直至最终得到完整的工作流模型。论文实现了该扩展算法,并将其作为挖掘插件集成到开源的过程挖掘框架ProM中。同时通过理论分析及模拟实验,对算法进行了全面的评估,验证了其对于复杂循环结构的挖掘能力要优于a过程挖掘算法。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 论文研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 论文研究内容
  • 1.4 论文组织结构
  • 第2章 工作流技术及过程挖掘
  • 2.1 工作流技术
  • 2.1.1 工作流的定义
  • 2.1.2 工作流模型及表示方法
  • 2.1.3 工作流模型分析与形式化验证
  • 2.1.4 工作流技术面临的主要问题
  • 2.2 工作流管理系统
  • 2.2.1 工作流管理系统定义及功能
  • 2.2.2 工作流管理系统体系结构
  • 2.2.3 工作流管理系统参考模型
  • 2.3 过程挖掘
  • 2.3.1 过程挖掘定义
  • 2.3.2 过程挖掘框架
  • 2.3.3 过程挖掘算法分析
  • 2.4 事件日志模型
  • 2.4.1 事件日志分析
  • 2.4.2 日志模型表示
  • 2.5 本章小结
  • 第3章 一种可发现复杂循环结构的扩展α过程挖掘算法
  • 3.1 α过程挖掘算法
  • 3.1.1 活动间因果依赖关系
  • 3.1.2 算法模型结构假设
  • 3.1.3 算法原理及分析
  • 3.2 循环结构分析及识别
  • 3.2.1 循环结构分析及定义
  • 3.2.2 可挖掘循环结构模型假设
  • 3.2.3 循环结构识别方法
  • 3.3 事件日志预处理
  • 3.3.1 日志中噪音处理
  • 3.3.2 事件日志的轨迹等价处理
  • 3.4 扩展α过程挖掘算法
  • 3.4.1 算法思想及框架
  • 3.4.2 算法分析
  • 3.5 本章小结
  • 第4章 实验验证及结果分析
  • 4.1 实验数据获取
  • 4.1.1 数据来源介绍
  • 4.1.2 日志格式要求
  • 4.2 算法评估准则
  • 4.3 扩展α过程挖掘算法实现
  • 4.4 实验结果分析
  • 4.4.1 实验一:基于人造实例的评估
  • 4.4.2 实验二:基于实际应用的评估
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    一种可发现复杂循环结构的扩展α过程挖掘算法
    下载Doc文档

    猜你喜欢