摘要
空间高效用co-location模式挖掘以模式中所有特征的参与效用之和为衡量标准,而未考虑模式的长度和稀有特征对模式效用的影响。一般而言,模式的长度越长或存在稀有特征,模式的效用可能越大。在空间高效用co-location模式挖掘研究的基础上,同时考虑模式的长度和可能存在的稀有特征。首先,提出含稀有特征的高平均效用co-location模式挖掘的相关定义;然后,构建含稀有特征的高平均效用co-location模式挖掘算法HAUWR,并在真实和合成数据集下对HAUWR进行大量实验,实验结果表明:HAUWR能够挖掘出满足条件的co-location模式完全集,并具有较好的可扩展性;最后,针对模式长度对高效用co-location模式的影响,HAUWR与含稀有特征的高效用co-location模式挖掘算法HUWR在数据集大小、距离阈值、特征稀有度等方面进行了对比。