摘要
枸杞作为宁夏重要的经济作物之一,被多种虫害寄生且产量极易受到影响,因此提高枸杞虫害防治能力对于稳固当地经济具有十分重要的意义。在大数据时代背景下,图像、文本等多模态数据爆发式增长,传统的单模态检索已不能满足人们多元化信息检索的需求。跨模态检索针对图文等多模态数据进行互检,更符合人们全面灵活的信息检索要求,构建可供跨模态检索技术使用的相关数据集对于农作物虫害防治具有非常重要的实际意义。为此我们构建了枸杞虫害图文跨模态检索数据集,包含枸杞虫害图像采集、文本撰写、数据增广、分类、图文对应等多方面内容。本数据集有17类常见枸杞病虫害图像文本数据共492 MB,其中虫害图像数据及与其对应的文本描述文件各为9496份,数据充足可供图文跨模态检索训练样本使用。本数据集将为枸杞虫害跨模态检索提供宝贵的基础数据资源,同时可作为农业领域大数据环境下机器学习的标准数据集,对促进跨模态在农业领域的发展和枸杞虫害防治研究,提高枸杞产量具有重要的实际应用价值。
- 单位