摘要

大数据时代的来临加深了经济学的研究范式改革,推动社会科学研究由模型驱动向数据驱动转型。本文将机器学习算法引入预测建模,探讨机器学习如何在金融保险领域的风险预测中发挥作用。在经济预测建模中,传统统计回归无法胜任复杂关系的捕捉,而传统的CART决策树容易陷入局部最优而导致预测水平不足的问题。作为一种较新的机器学习方法,进化树是对传统决策树的改进,本文重点对进化树算法的基本原理进行探讨。进化算法应用于树的生成,可以达到全局最优。在经济预测建模应用方面,本文选取机器学习平台OpenML上的两个数据集(Credit和WorkersCompensation),将树方法应用于预测分析:对于Credit数据集,通过构建分类树,探索影响银行客户信用风险发生的可能因素;对于WorkersCompensation数据集,通过构建回归树,对工伤保险赔付进行预测建模,同时探索工伤保险赔付的影响因素。结果发现,进化树算法在保持一定可解释性的同时,能有效提升分类准确率和预测精度。同时,由于树方法会隐性地体现变量之间的交互项和非线性关系,因此进化树模型的构建可补充传统统计回归分析,在经济学的预测问题中具有一定潜力。

全文