摘要
电商数据所属类别对于分析电商数据有重要意义,基于人力的分类无法适应如今海量的电商数据,基于传统算法模型的分类难以提取有价值的人工特征.本文采用BiLSTM模型并且引入注意力机制,将其应用于电商数据分类中.该模型包括Embedding层、BiLSTM层、注意力机制层和输出层. Embedding层加载Word2Vec开源工具训练得到的词向量, BiLSTM层捕捉每个词语的上下文信息,注意力机制层为每个词语分配权重,合成新的样本特征.实验表明,基于逆类别率的注意力机制在电商数据的分类准确率达到91.93%,与不加注意力机制的BiLSTM模型和其他引入的注意力机制相比,均有不同程度的提高.此模型电商数据分类中有良好的效果,为注意力机制的引入提供了新的思考方向.
-
单位智能信息处理与实时工业系统湖北省重点实验室; 武汉科技大学