通过对比人工选择特征、相关性检验、降维算法以及基于集成学习的自适应特征提取方法,找出不同的特征选择方法以及不同的分类算法对微博水军的识别带来的影响。实验验证了高区分度的自适应特征提取方法对水军的识别效果带来较大提高,由于特征数量的减少,水军识别所需要的时间花费也明显降低,对于微博网络海量数据的识别具有一定意义。