摘要

P2P行业在我国非正规金融市场占据着非常重要的地位,近年来逐渐暴露出大量风险问题,其中,雷潮现象更是使得行业遭遇发展困境,引起了公众的担忧。利用Python网络爬虫收集"网贷之家"官方网站的公开数据,并运用随机森林模型对平台的风险进行预测,同时测算平台各风险因素的重要程度。研究发现,P2P平台风险识别准确率达到92.15%,运营时间、平均预期收益率以及待还余额等因素是识别平台风险的关键因素。