摘要

旅游规模预测研究亟待应用旅游大数据及其适应性方法,以提升预测的准确度。文章基于多来源搜索引擎指数和UGC数据,以ARIMA模型为基准,综合运用灰色关联度分析、TF-IDF自然语言处理技术、机器学习领域中适用范围最广的RF与SVR模型,对重庆市月度旅游规模展开预测。研究发现:融合多来源搜索引擎指数与包含旅游者丰富心理信息的UGC数据进行的旅游规模预测,在三种模型中的预测精度均呈提升态势,说明多源旅游大数据对目的地潜在客流具有前兆作用。在相同数据集约束下,ARIMAX、RF、SVR三种模型的预测精度递增,表明机器学习算法对于旅游大数据具有更强的分析与处理能力。文中提供了集成多源异构旅游大数据与高效的机器学习算法以回应城市旅游规模预测问题的新思路。

全文