摘要

针对垃圾图片背景复杂和数量少等情况导致的神经网络准确率不高和泛化能力弱的问题,提出利用CutMix数据增强技术对数据集进行扩展,并在VGG16网络模型的基础上分别加入L1、L2正则化构建更为具体的损失函数,防止过拟合现象的发生。将上述改进分为8种模型,对4大类30个小类的14 921张垃圾图像分别训练,得到准确率和损失值。实验结果表明,原VGG16网络模型的准确率为91.17%;加入L1正则化并将数据集利用数据增强技术扩展增加9 350张图片后,准确率提升最大为92.26%,提升幅度为1.09%。通过对比分析,改进后的网络无论是准确率还是泛化能力都有了明显的提升;此外,在单独引入L1正则化或L2正则化后,模型的损失函数变得光滑且不再过早趋于平稳,有效避免了过拟合和梯度消失情况的发生,改善了网络的整体性能。

全文