摘要
上市公司披露的财务信息对财务报告使用者决策有重大影响。随着上市公司的舞弊手段越发多样化和隐蔽化,传统的分析手段较难发现舞弊行为。机器学习模型不同于传统的分析模型,因其能够有效判别上市公司的舞弊行为而被越来越多的研究所关注,若能有效应用于实务,则对辅助财务报告使用者决策大有助益。机器学习模型判别效果高度依赖于输入指标的质量,文章针对现有相关研究存在的不足,提出改进机器学习模型输入指标选择的方法,即提升初始输入指标数量、最大化正负样本的特征差异和利用实证模型对初始指标进行筛选等。实证研究结果表明,Logistics回归分析模型可以用于敏感指标筛选,敏感指标筛选有助于机器学习模型分类识别准确率的提升,同时研究还发现随机森林机器学习模型在初始指标集就有较好的判别效率。