摘要
[目的]研究创业板上市公司财务造假检测识别问题,构建异常检测模型对公司财务欺诈进行检测和识别。 [方法]构建了基于数据融合的财务造假异常检测研究框架,在数据层融合了结构化和文本数据、财务及非财务信息的多源异构数据并构造特征,在信息层组合了不同的采样和集成分类模型,在知识层融合领域现状构造了模型评价指标。 [结果]非平衡处理后模型各项评价指标优于未处理的结果,优化后SMOTE+ENN+LightGBM模型的F_(β)达到0.77,此外,包含多种类型特征的检测结果优于仅包含单一类别的检查结果。 [局限]本文的方法主要用于发掘市场中可疑的财务造假公司,无法区分和判断具体的造假类别。 [结论] 非平衡处理有利于提升模型对异常样本的识别能力,融合多源异构数据对财务造假的识别有积极作用,为监管部门对上市公司财务造假检测提供了参考。
- 单位