用于流程发现的局部日志采样方法

作者:倪可; 俞东进*; 孙笑笑; 胡华
来源:计算机集成制造系统, 2022, 28(10): 3166-3174.
DOI:10.13196/j.cims.2022.10.013

摘要

针对传统流程发现算法在处理大规模事件日志时的性能瓶颈问题,提出一种基于轨迹信息增量的日志采样方法,通过量化事件之间的直接跟随关系和轨迹的特征信息,将轨迹是否带有新的流程行为作为采样标准,基于统计理论确定了最小连续遍历样本数量。为了进一步提高预处理速度,提出二进制指数跳跃算法来避免扫描重复轨迹。通过4个真实事件日志的实验表明,所提采样方法可以快速有效地缩小事件日志的规模,并保留关键的控制流和频率信息,同时提高流程发现算法的运行速度。

全文