本发明公开了一种基于词向量和集成SVM的文本数据流分类方法,其步骤包括:1、从文本数据集中获取种子文本集;2、对种子文本集进行词向量扩充处理,获得相应的特征词典及噪声词典;3、对所述文本数据集进行特征加权向量化处理,获得相应的文本向量集;4、构建集成分类器,获得所有文本的分类结果。本发明能在降低计算复杂度的情况下,通过充分利用数据特征来提高分类结果的准确率,从而满足解决实际问题的需要。