摘要

以我国2010—2019年的A股上市银行年报为样本,利用LDA主题模型深度挖掘年报语义信息并构建银行年报的主题指标,在多种机器学习模型上对比主题指标与常用的财务指标、文本特征指标及其与主题指标的合并指标在检测上市银行违规时的性能。研究发现:年报文本主题内容对上市银行的违规行为有一定的预测作用,且与单一传统指标相比,主题指标可以提升传统指标的违规识别性能。研究结果为使用年报文本主题信息和机器学习方法识别上市银行违规的有效性提供了直接的证据,为市场构建了一种有效的违规识别指标体系,为审计师找到了一种较为高效的违规识别方法,有助于进一步规避与防范审计风险。

  • 单位
    南京审计大学