摘要

随着互联网上用户移动数据的日益繁荣,用户的移动行为预测也成为了预测研究的热点。近年来,循环神经网络(RNN)技术因其高效性和扩展性在移动预测中得到了广泛的应用。但是,目前大部分网上收集到的用户移动行为数据普遍具有稀疏和异质的特性,特别是当用户出于习惯或隐私考虑可能会拒绝向平台提交活动记录。因此在这些稀疏数据集上基于RNN的预测技术无法有效地学习到足够的用户行为特征,从而影响了模型的预测性能。为了解决该问题,本文提出了一种融合信息网络结构的数据增强行为预测算法。具体来说,首先我们将用户历史行为数据转为信息网络图;然后通过该信息网络的模块度来评估用户的信息传递效率;最后根据信息传递效率对用户的朋友数据进行采样,将具有高信息传递效率的朋友数据嵌入到用户数据中对用户数据进行增强。在真实数据集Yelp上的实验结果显示,我们的方法可以起到对现有算法模型增强的作用,所有模型的预测性能都得到了大幅提升。