摘要

来自社交网络的时空大数据具有海量和高动态的特性,有效选择时空数据进行聚焦挖掘分析至关重要。以微博位置签到数据为例,首先,对时空大数据空间聚类挖掘的有效选择问题进行了研究,针对社交网络时空数据不确定性问题,提出了时空大数据针对聚类挖掘的有效选择方法。聚类挖掘有效选择方法提出从空间、时间或属性等维度对时空大数据进行分割。然后,对分割得到的数据集进行空间探索分析(exploratory spatial data analysis,ESDA),得到具有聚类挖掘潜力的数据集。最后,以武汉市微博位置签到数据进行商圈热点探测为例,对提出的社交网络时空大数据聚类挖掘有效选择方法进行验证。结果表明,有效选择方法可以得到挖掘效率和精准性更高的时空数据集。