摘要

为了有效识别财务报表欺诈,解决现有欺诈检测模型应用局限性问题,并对上市公司财务危机做出准确预测,提出了一个基于Zipf定律的随机森林财务预警模型。首先,对财务数据集进行特征选择,运用随机森林算法计算特征变量重要性,筛选后得到用于分类检测的最优特征子集;其次,通过构造Zipf因子,生成新的特征向量补充到数据集中以挖掘更多有效信息,并将其与随机森林模型结合,识别具有财务欺诈风险的样例,得到分类预测结果;最后,基于1997—2017年中国A股上市公司的财务数据进行100次重复实验,以AUC值、准确率、召回率、特异度等指标对模型进行评价,并对比该模型与其他几种预警模型的预测性能,结果表明,基于Zipf定律的随机森林模型对上市公司财务风险的预测效果更优。

全文