摘要

本文的数据来源于国内一家银行的内部数据,包括客户的信贷历史、还款记录和逾期情况等,由于不均衡数据的性质,需要对训练集进行过采样,从而使得逾期和不逾期的数量相对均衡。并且可以将时间和特征看作两个维度,采用人工编码的方法,将多特征序列数据编码为人工图像,一方面,多特征时间序列可以看作图像作为CNN的输入,另一方面,也可以看作时间序列,采用LSTM提取特征。CNN在特征提取方面的优势和LSTM在时序预测方面的优势可以在融合过程中表现出来,评估结果也表明,LSTM-CNN融合模型的表现优于单一的 CNN 和 LSTM 模型。