摘要

电信数据特征具备含有缺失率、量纲相差大、内在相关性高等特点,现有特征挖掘技术无法完全适用。由此,本文设计了一种新型特征挖掘方法,从缺失率、标准差、相关性和重要度4个维度出发,分别拟合指标量化评估函数,并加权计算综合评分来挖掘特征。最后,本文使用实际业务数据,与业内最常用的随机森林特征挖掘方法进行比较,得出本文设计的方法从更多维度综合衡量,其特征挖掘结果更加科学合理,并且节约25%时间成本,实用性强。