摘要
本文首先提出采用网络爬虫文本挖掘技术,结合新闻报道及学术研究信息数据(新华网和谷歌学术搜索网)两个数据来源,根据预测最小偏差采用动态权重方法构建我国2002年1月至2021年12月的中国经济政策不确定指数,研究其统计性质,并且采用混频VAR模型融合该指数对我国11个主要宏观变量进行了预测,实证研究发现:1)本文构建EPU指数与现实经济政策及内外经济环境不确定一致性较高,我国经济政策不确定指数具有时间序列长记忆特征,对未来经济波动具有持续影响效应; 2)本文构建EPU指数对我国11个主要宏观经济变量预测优于不包含EPU指数及基于报纸信息编制的EPU指数; 3)根据混频VAR模型预测,经济政策不确定对我国主要宏观经济波动存在负向显著效应,我国2022年GDP增长率预测区间波动幅度为2%,城镇登记失业率呈现波动幅度越来越大的趋势.本文采用大数据网络爬虫文本挖掘技术构建动态经济政策不确定动态指数,避免了信息量过少导致的采样误差及媒体报道的主观偏差性,多来源大数据文本挖掘动态权重技术可为我国货币政策不确定指数、财政政策不确定指数等其它不确定指数构建提供可行策略.
- 单位