摘要
目的探究一种基于InceptionV3-CNN模型的食品图像识别和分类方法。方法选取包含20类食品和19609张的食品图像建立数据集Food-101,通过卷积神经网络(convolutional neural networks,CNN)提取图像候选区域的视觉特征,并自动进行分类,使其具有较高的识别率;此外,采集来自kaggle库中已标注的食品图像集做预测对比实验,以保证InceptionV3-CNN模型检测的准确度。结果该方法能够去除背景噪音,且仅需部分提取视觉特征,可以有效解决网络食品图像的分类问题,与多视图支持向量机(support vector machine,SVM)+方向梯度直方图(histogram of oriented gradients,HOG)和传统CNN方法相比,在测试时间相近、设备计算能力相同的条件下,该方法识别率更高,迭代次数为15000次时,Loss值降至4.92,准确率可达93.89%。结论此方法可以快速识别食品图像,在实际网络图片中能有较好的可移植性。将算法移植到移动设备中实现APP的模块化操作也将成为后续工作探索的重点方向。
- 单位