摘要
提出一种基于关键n-grams和门控循环神经网络的文本分类模型.模型采用更为简单高效的池化层替代传统的卷积层来提取关键的n-grams作为重要语义特征,同时构建双向门控循环单元(gated recurrent unit,GRU)获取输入文本的全局依赖特征,最后将两种特征的融合模型应用于文本分类任务.在多个公开数据集上评估模型的质量,包括情感分类和主题分类.与传统模型的实验对比结果表明:所提出的文本分类模型可有效改进文本分类的性能,在语料库20newsgroup上准确率提高约1.95%,在语料库Rotton Tomatoes上准确率提高约1.55%.
- 单位