基于日志的流程挖掘算法研究

基于日志的流程挖掘算法研究

论文摘要

当今的信息系统大多都是精确流程模型驱动的。工作流管理系统,还有ERP、CRM和B2B,都是基于任务的工作流模型配置的。实现一个工作流设计是一个耗时间的复杂过程,而且经常在实际的工作流程和管理的工作流之间存在差异。本文给出了一个新的建模方法以支持精确流程建模,我们称这种建模方法为“基于日志的流程挖掘”,即从已经存在的业务流程执行过程产生的日志中挖掘出我们需要的工作流模型。我们用到的日志叫做“事件日志”,该日志将流程中的每个任务作为一个原子事件来处理。本文首先介绍了工作流技术最新的发展状况,以及WfMC的工作流参考模型,然后文章总结了当前工作流建模的主要方法,提出了工作流建模领域存在的机遇和挑战。在详细讨论流程挖掘方法前,文章对与挖掘有关的技术和理论进行了描述,包括日志的数学表达模型,Petri网和工作流网的相关属性,Petri网到工作流网的映射关系等。本文讨论了最具有挑战性的问题—非结构化流程挖掘,主要是非自由选择结构的挖掘。其中分为两个部分:流程挖掘算法和流程挖掘算法的改进。在第一部分,文章给出了一种基于日志的新的流程挖掘算法,给出了算法的Java实现。算法分两步,首先根据日志中任务间的先后顺序,确定流程中各任务间的连线,从而得到流程图的结构,进一步分析流程日志确定顺序,选择,并行,循环等关系。在第二部分,在此算法的基础上进行改进,实现了非自由选择结构的挖掘。其基本思想是,采用“默认存在”的思想,即对于日志的每一条执行轨迹中所有的不相邻任务,其相连的可能性都看成是存在的,然后根据对日志的分析排除不可能相连的任务对,确定选择线。该种方法得到的流程图是合理的,安全的,并且是容易理解的。最后,通过运行模拟日志获得足够的实验数据,对该算法的挖掘质量进行了检验分析,证明该算法在复杂流程的挖掘方面具有明显优势。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 课题提出的背景和意义
  • 1.2 国内外研究进展情况
  • 1.3 本文主要研究内容和特色
  • 第2章 工作流技术介绍
  • 2.1 工作流的定义
  • 2.2 工作流参考模型
  • 2.3 工作流建模方法
  • 2.4 工作流模型验证与分析
  • 2.5 BPM在证券业中的应用研究
  • 第3章 流程挖掘相关技术的数学定义
  • 3.1 流程挖掘概念的引入
  • 3.2 流程挖掘的对象—流程日志
  • 3.3 流程日志的数学表示
  • 3.4 流程挖掘的模型表示—Petri网
  • 3.5 重发掘能力研究
  • 3.6 结构化工作流网(SWF)
  • 第4章 流程挖掘算法
  • 4.1 流程挖掘的基本思路
  • 4.2 流程挖掘算法
  • 4.2.1 确定流程图结构
  • 4.2.2 确定任务间关系
  • 4.3 流程挖掘实例
  • 4.3.1 不带循环的流程
  • 4.3.2 带循环的流程
  • 第5章 非自由选择结构挖掘算法
  • 5.1 非自由选择结构
  • 5.2 非自由选择结构的挖掘
  • 5.2.1 算法改进的思想
  • 5.2.2 非自由选择结构挖掘算法
  • 5.3 算法分析
  • 第6章 实验数据分析
  • 6.1 实验方法和实验数据的准备
  • 6.2 实验结果分析
  • 第7章 结束语
  • 参考文献
  • 致谢
  • 攻读学位期间发表的主要学术论文目录
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于日志的流程挖掘算法研究
    下载Doc文档

    猜你喜欢