摘要
本文对比了常用的文本表示方法(包括离散表示方法:One-hot表达、BagofWords词袋表达、Tf-Idf权值向量表达,和神经网络表示方法中的Word2Vec模型),以及文本分类模型中的CNN、RNN,到LSTM和BiLSTM。给出基于Word2Vec词嵌入和双向长短时记忆网络BiLSTM的文本分类实现。
- 单位
本文对比了常用的文本表示方法(包括离散表示方法:One-hot表达、BagofWords词袋表达、Tf-Idf权值向量表达,和神经网络表示方法中的Word2Vec模型),以及文本分类模型中的CNN、RNN,到LSTM和BiLSTM。给出基于Word2Vec词嵌入和双向长短时记忆网络BiLSTM的文本分类实现。