摘要
针对农业新闻目前面临的针对性差、分类不清和数据集缺乏等问题,提出一种基于ERNIE、深度金字塔卷积神经网络(DPCNN)和双向门控循环单元(BiGRU)的农业新闻分类模型——EGC。首先,利用ERNIE对数据集进行编码;然后,同时经过改进后的DPCNN和BiGRU提取特征;最后,将两者所提取句子的特征进行拼合并经过Softmax得到最终结果。为了令EGC模型更加适合应用在农业新闻分类领域,对DPCNN进行改进,分别减少其卷积层,从而保留更多特征。最终结果与基础ERNIE相比准确率提升了1.29个百分点,按类别来说,种植业、畜牧业和副业的准确率达到了最高值,在种植业上EGC模型提升高达4.0个百分点以上。
- 单位