数据化的信息时代,人们一直期待能够将没有代表性的冗余的特征去除,从而使获得的数据是通常由有效的、具有代表性的特征表示的。通过特征筛选去建立一个预测精度高的可解释模型。正则化下的稀疏模型是识别积极活跃特征的一种流行技术。总体来说,特征筛选目标为:剔除不具代表性的冗余特征,识别积极的有效特征;可解释性好的高准度预测模型。筛选出有效的特征不仅可以提高计算效率,还能提高预测模型的精准度。