一种基于日志相似度的轨迹聚类评估方法

作者:张帅鹏; 李会玲; 李婷; 徐兴荣; 刘聪*
来源:山东科技大学学报(自然科学版), 2021, 40(05): 107-115.
DOI:10.16452/j.cnki.sdkjzk.2021.05.012

摘要

信息系统收集了大量的业务过程事件日志,过程发现旨在从事件日志中发现过程模型。但面对高度灵活的环境,简单地应用已有的过程发现技术通常会产生不可理解的过程模型(即意大利面模型)问题。轨迹聚类方法允许分解现有的事件日志,从而有效地解决这一问题。现有的轨迹聚类方法有很多,如基于向量空间方法的聚类、基于上下文感知的聚类、基于模型的序列聚类等,通过不同的轨迹聚类方法得到的聚类效果也存在差异。评价聚类效果有很多指标,如基于模型挖掘质量的F-Measure,但已有的聚类评估指标效率低下且操作复杂,不具备简洁性和高效性。本研究提出一种基于日志相似度的轨迹聚类评估方法,通过比较聚类子日志之间的相似程度来衡量聚类日志的质量。通过对仿真事件日志和真实事件日志的实验分析表明,所提出的评估方法为轨迹聚类方法提供了一种良好的参考标准。

全文