摘要

在海量序列数据中,预测群体用户在未来一段时间中的可能行为模式是一个非常有意义且具有挑战性的研究问题。本文以公交用户群体出行为例,通过引入相空间重构法,利用海量序列数据对大型系统建立模型来模拟其动态演化模式。同时,考虑到一般相空间预测方法在大数据情况下的不足,提出了相似性拐点方法进行预测前的相似点的自动挑选工作,该方法不但降低了预测过程中的相似度计算复杂度,同时也显著提升了预测效果。实验证明,本文的方法对于探讨利用海量(周期性)序列数据进行系统建模,以及预测一段时间内的群体行为提出了新的思路。