论文摘要
当今的信息系统大多都是精确流程模型驱动的。工作流管理系统,还有ERP、CRM和B2B,都是基于任务的工作流模型配置的。实现一个工作流设计是一个耗时间的复杂过程,而且经常在实际的工作流程和管理的工作流之间存在差异。本文给出了一个新的建模方法以支持精确流程建模,我们称这种建模方法为“基于日志的流程挖掘”,即从已经存在的业务流程执行过程产生的日志中挖掘出我们需要的工作流模型。我们用到的日志叫做“事件日志”,该日志将流程中的每个任务作为一个原子事件来处理。本文首先介绍了工作流技术最新的发展状况,以及WfMC的工作流参考模型,然后文章总结了当前工作流建模的主要方法,提出了工作流建模领域存在的机遇和挑战。在详细讨论流程挖掘方法前,文章对与挖掘有关的技术和理论进行了描述,包括日志的数学表达模型,Petri网和工作流网的相关属性,Petri网到工作流网的映射关系等。本文讨论了最具有挑战性的问题—非结构化流程挖掘,主要是非自由选择结构的挖掘。其中分为两个部分:流程挖掘算法和流程挖掘算法的改进。在第一部分,文章给出了一种基于日志的新的流程挖掘算法,给出了算法的Java实现。算法分两步,首先根据日志中任务间的先后顺序,确定流程中各任务间的连线,从而得到流程图的结构,进一步分析流程日志确定顺序,选择,并行,循环等关系。在第二部分,在此算法的基础上进行改进,实现了非自由选择结构的挖掘。其基本思想是,采用“默认存在”的思想,即对于日志的每一条执行轨迹中所有的不相邻任务,其相连的可能性都看成是存在的,然后根据对日志的分析排除不可能相连的任务对,确定选择线。该种方法得到的流程图是合理的,安全的,并且是容易理解的。最后,通过运行模拟日志获得足够的实验数据,对该算法的挖掘质量进行了检验分析,证明该算法在复杂流程的挖掘方面具有明显优势。