摘要

从图模式中挖掘频繁子图的最大挑战是候选模式的大量产生,特别在大型图模式的情报数据集中,以至于合理的计算资源无法完整枚举频繁子图的总数。文中提出一种基于图模式的犯罪情报数据集挖掘k-频繁子图算法。首先,将图模式进行预处理得到k个顶点子图的新数据集;然后,从新图模式集中获得所有k个顶点的生成子图;最后,通过k顶点的生成子模式得到k-频繁子图,在真实犯罪情报数据集上验证了算法的有效性。