摘要
互联网的产生与应用为了解消费者心理与行为提供了新的途径,为提高消费者信心指数预测准确性与时效性提供了大量的优质数据。本文以互联网数据的两个典型代表:网络搜索关键词指数数据和网络新闻文本数据为依据,采用滑动时间窗口动态筛选解释变量,运用多种机器学习方法建立模型对消费者信心指数进行预测。研究发现:在提前1~2个月的消费者信心指数预测中自适应提升树回归模型表现最好,其次是Lasso回归模型;在提前3~4个月的消费者信心指数预测中多层感知机回归模型和Lasso回归模型表现最好,其次是自适应提升树回归模型;提前4个月的预测模型精度要明显高于其他提前期的预测精度。结果表明,本文提出的关键词滚动筛选及模型滚动更新方法,能够有效提高预测模型对互联网热词变化的适应能力,相对于宏观经济数据而言,利用互联网数据建立的机器学习模型确实能更早地"感知"消费者信心的变化,预测消费者信心指数,且具有较高的预测准确率。
- 单位