摘要
目的对基于深度学习的ResNet50-OC模型彩色眼底照片质量多分类的效果进行评估。方法纳入2018年7月在南京医科大学附属明基医院收集的彩色眼底照片PD数据集及EyePACS数据集, 临床医师根据眼底图像的成像质量将其大致分为质量较好、曝光不足、曝光过度、边缘模糊和镜头反光5类。在训练集中, 每个类别包含1 000张图像, 其中800张选自EyePACS数据集, 200张选自PD数据集;在测试集中, 每个类别包含500张图像, 其中400张选自EyePACS数据集, 100张选自PD数据集。训练集总计5 000张图像, 测试集总计2 500张图像。对图像进行归一化处理和数据扩增。采用迁移学习方法初始化网络模型的参数, 在此基础上对比当前深度学习主流分类网络VGG、Inception-resnet-v2、ResNet和DenseNet, 选取准确率和Micro F1值最优的网络ResNet50作为分类模型的主网络。在ResNet50训练过程中引入One-Cycle策略加快模型收敛速度, 得到最优模型ResNet50-OC并将其应用于眼底照片质量多分类, 评估ResNet50与ResNet50-OC对眼底照片进行多分类的准确率和Micro F1值。结果 ResNet50对彩色眼底照片质量多分类准确率和Micro F1值明显高于VGG、Inception-resnet-v2、ResNet34和DenseNet。ResNet50-OC模型训练15轮对眼底图像质量多分类准确率为98.77%, 高于ResNet50训练50轮的98.76%;ResNet50-OC模型训练15轮对眼底图像质量多分类的Micro F1值为98.78%, 与ResNet50训练50轮的Micro F1值相同。结论 ResNet50-OC模型可以准确、有效地对彩色眼底照片质量进行多分类, One-Cycle策略可减少训练次数, 提高分类效率。
-
单位电子信息工程学院; 南京医科大学第二附属医院; 南京航空航天大学