摘要
传统的P2P网络借贷违约风险评价通常仅使用接受样本建模,而模型的应用对象是包括接受和拒绝的全部样本,由此带来的样本选择偏差问题会影响模型的泛化能力,需要拒绝推断校正样本选择偏差。利用半监督方法构建违约风险模型,可以将拒绝推断过程嵌入到违约风险评价过程中,在训练违约风险评价模型的同时通过对添加到建模样本中的拒绝样本进行筛选以控制噪音。本文提出基于样本和特征双重差异的协同训练模型TRICMV进行P2P网络借贷违约风险评价。该模型采用了一种基于"噪音学习理论"的自适应的模型迭代机制,可以确定融入模型的拒绝样本的最佳数量。最后,基于人人贷平台标的样本进行实证分析,结果验证了TRICMV模型优于传统的违约风险评价模型以及其它使用半监督学习进行拒绝推断的违约风险评价模型。
- 单位