摘要

针对当前矿物识别领域存在的精度不佳、适应性差、携带不便等问题,提出了一种基于改进MobileNet V3的矿物智能识别模型(CA-MobileNet V3)。为获得研究所需的有效数据集,通过由mindat.org网站和自行拍摄的方式获取的矿物图像创建了一个包含19种矿物的数据集,对其进行数据增强处理,并按照8:1:1的比例划分为训练集、验证集和测试集。为提升模型对图像信息的特征提取能力,引入协调注意力机制,用以替代轻量型MobileNet V3模型的原始SE注意力机制,以提高矿物识别准确率。最后,采用迁移学习方法预训练CA-MobileNet V3模型,以加速模型收敛、提高泛化能力、避免过拟合。在训练过程中,将CA-MobileNet V3与mobilenet v3、MobileNet V3、ShuffleNet V2、EfficientNet V2等模型进行了性能比较。结果表明:各迁移模型均展现出显著的收敛速度优势,而CA-MobileNet V3矿物智能识别模型的Top1-准确率、Top2-准确率、f1-score值分别达到93.90%、98.58%和93.89%,在所有模型中效果最佳,且模型大小仅为4.61 MB,属于轻量化模型。为验证模型有效性,t-SNE可视化分析被用于不同模型的识别效果比较,可进一步印证CA-MobileNet V3模型的优越性。