摘要
公司违规研究一般采用传统的线性回归模型处理历史数据,本文则构建了基于机器学习算法的公司违规预测模型并实施检验。研究发现:(1)通过比对分析可知,广为使用的线性回归模型不能充分挖掘数据信息并进行有效预测,机器学习的树模型(Random Forest和GBDT)和神经网络模型(RNN和LSTM)的预测效果更优;(2)采用SHAP方法探寻公司违规的重要预警因子及其贡献度,发现公司治理相关变量对违规预警具有重要贡献,传统线性回归模型过分强调财务数据的预警能力,弱化了公司治理因子对违规预警的贡献;(3)进一步采用SHAP方法将Random Forest和GBDT模型的运作过程和贡献分布可视化,挖掘重要因子对公司未来违规的影响机理,并计算主要影响因子的警惕阈值。本研究实现了公司违规行为预测研究方法的创新,对投资者和监管机构的决策优化具有借鉴意义。
-
单位南京审计大学; 哈尔滨工业大学(深圳); 经济管理学院; 厦门大学; 会计发展研究中心