摘要

大数据和机器学习正在改变经济统计学的研究范式与方法。宏观经济数据作为统计产品,用于描述一定范围内的经济状态或联系。与微观多源异构数据一样,宏观经济数据也具有融合二次开发的潜质,且具备更好的数据质量保障。本文在梳理机器学习数据融合方法的基础上,指出一类宏观经济数据融合任务,提出一种宏观经济数据融合方法,旨在提高预测能力。首先,通过论证经济状态数据、经济关联数据的可融合形式特征,给出提取不同类型数据共同特征的模型化表示方法;进而提出一种数据融合模型,给出模型求解的交替迭代求解算法,该模型可以统一处理数据融合基础上的无监督学习、监督学习和半监督学习任务。并且,本文基于2017年中国统计年鉴、2017年中国投入产出表和2017—2018年中国经济景气月报数据开展数据融合应用,结果表明,与非融合方法相比,数据融合方法提高了预测精度。

全文