摘要

在信用卡违约预测中,信用卡数据存在有标签获取难度大和分布不均衡的问题,使得经典的数据挖掘算法分类效果不佳。针对以上问题,将深度学习中的Transformer作为编码器对原始数据进行自编码,挖掘和建模用户数据的深层信息,将编码后的向量送入传统分类模型进行分类预测,从而判断该用户是否存在违约行为。在有标签数据规模较小时,提出算法的召回率相比于传统分类算法有了显著的提升,实验结果验证了算法的有效性。