摘要

为了提高文本分类的准确性,扩展分类任务的多样性,提出一种结合一维卷积神经网络(1D-CNN)和双向长短期记忆网络(Bi-LSTM)的文本分类方法。首先,为了解决近义词、多义词的表征困难,采用GloVe模型表示词特征,充分利用全局信息和共现窗口的优势。然后,利用1D-CNN进行特征提取,以降低分类器或预测模型的输入特征维数。最后,对分类模块Bi-LSTM进行优化,其隐藏层由两个残差块组成,并引入注意力机制进一步改善预测的准确度。在多个公开数据集中进行二元分类和多元主题分类实验。实验结果表明,与其他优秀方法相比,所提方法在准确率、召回率和F1得分方面的性能更优,最高准确度达92.5%,最高F1得分为91.3%。

全文