摘要

co-location模式是空间特征集合的一个子集,模式中不同特征的实例频繁出现在邻近区域内。纵观高效用co-location模式挖掘的相关研究报道,现存的高效用co-location模式挖掘方法没有考虑模式的长度对模式效用的影响。为了探索这一问题,提出一种从空间数据集中挖掘高平均效用co-location模式的算法(HAUCP),以便更好地评价co-location模式的真实效用。首先,基于空间数据集提出高平均效用co-location模式的完整定义;其次,构建了高平均效用co-location模式挖掘的基本算法,并探索了两种有效的剪枝策略以提升算法的运行效率;最后,在真实数据集和合成数据集上对算法的有效性和可扩展性进行了大量实验,实验结果表明HAUCP算法挖掘出的高效用co-location模式更加合理。