摘要

本发明公开了一种基于特征扩展的在线短文本数据流分类方法,其步骤包括:1根据外部语料库构建Word2vec模型,获取词向量集合Vec;2利用Vec向量化短文本数据流并基于CNN模型进行文本向量化扩展;3对扩展后的文本向量构建在线深度学习网络;4对LSTM网络中神经元引入概念漂移信号量并检测短文本流的分布变化;5完成在线深度学习网络的模型更新与对短文本数据流的预测。本发明能够有效的提高短文本数据流分类准确率、正确地检测概念漂移并调整模型,从而达到快速适应短文本数据流环境的目的。