摘要
为解决农业领域问答数据集缺乏以及目前大多采用端到端模型用于问题生成任务等不足,通过系列数据爬取、清洗、过滤和标注等工作,构建农业领域问题生成数据集,同时研究了基于NEZHA-UniLM预训练模型的农业领域问题生成。与其他基准模型相比,NEZHA-UniLM模型的BLEU-4和Rouge-L达到0.383 0和0.583 9。相较于未加对抗训练的预训练模型,其BLEU-4和Rouge-L分别提升了0.068 9和0.113 8。与基准模型NQG进行对比,BLEU-4和Rouge-L分别提升了0.195 3和0.151 7。结果表明,该模型不仅有效缓解生成问题与答案匹配度低、生成问题漏词或者多词和曝光误差等问题,还能有效提高生成问题的质量。
- 单位