摘要
为解决农业病虫害问句分类过程中存在公开数据集较少、文本较短、特征稀疏、隐含语义信息较难学习等问题,以火爆农资招商网为数据源,构建了用于农业病虫害问句分类的数据集,提出了一种用于农业病虫害问句分类的深度学习模型BERT_Stacked LSTM。首先,BERT部分获取各个问句的字符级语义信息,生成了包含句子级特征信息的隐藏向量。然后,使用堆叠长短期记忆网络(Stacked LSTM)学习到隐藏的复杂语义信息。实验结果表明,与其他对比模型相比,本文模型对农业病虫害问句分类更具优势,F1值达到了95.76%,并在公开通用领域数据集上进行了测试,F1值达到了98.44%,表明了模型具有较好的的泛化性。
- 单位