摘要

对信用卡客户进行潜在风险识别对于银行的资金安全具有重要的意义。利用分类算法对客户进行分类是一种可行的解决方案。利用决策树、朴素贝叶斯、支持向量机等多种成熟的分类算法对信息卡数据集进行了分析,在Model Building Time、Overall Accuracy、TP Rate、FPRate、Kappa statistic和ROC Area六个统计量上对它们的效果进行比较。为银行在信用卡审批时,使用数据挖掘分类算法从大量客户中辨识出风险客户提供实验依据。