摘要

【目的】解决传统的空间co-location模式挖掘方法在研究类似污染源与癌症病例这两大类特征之间的关系时,会挖掘出大量用户不感兴趣的模式且只考虑模式的频繁性等问题。【方法】首先,利用Voronoi图的性质结合星型实例模型,定义空间实例之间的邻近关系和空间序偶模式的概念;其次,考虑距离衰减效应和影响叠加效应,定义空间序偶模式的频繁度与影响度;最后提出了一个挖掘相应序偶模式的基本算法和一个优化算法。【结果】所提挖掘算法均能挖掘出传统算法挖掘不到的用户感兴趣的结果,且结果数量比传统算法少很多,相比于基本算法,优化算法的剪枝率达到80%以上,数据集越大,效果越好。【局限】默认数据都是点空间对象,扩展空间对象有待进一步研究。【结论】空间序偶模式可以更好地研究类似污染源与癌症病例这两大类特征之间的关系。