摘要
本发明公开一种大数据样本的智能化模糊特征选择方法,涉及大数据样本预处理中的特征工程领域,具体方案为:包括以下步骤:S1:特征选择步骤转换为计算模糊特征选择向量W(W1,W2,W3…,Wi,…,Wn),其中每一个Wi取值在[0,1]区间,取0时表示第i项特征舍去,取1时表示第i项特征选择;S2:针对每一个样本的特征Xi,换算公式添加取舍度向量Y(Y1,Y2,Y3,…,Yi,…,Yn),每个分量Yi∈[0,1];S3:Wi与Yi对比,分为两个区间,在两个区间范围内分别选取Wi为0或为1;S4:得到每个特征计算结果,进行每个特征的提取或舍去。本发明采用粒子群优化算法学习特征权重向量,为大数据样本特征提供一种智能化模糊特征选择方法。
- 单位