基于深度学习的多分类正畸图像识别研究

王少烽; 谢贤聚; 张莉; 常荍; 左飞飞; 王亚杰; 白玉兴<sup>*</sup>

摘要

目的基于深度学习开发用于正畸图像数据自动分类的多分类正畸图像识别模型, 为正畸图像数据管理提供参考。方法收集2020年10至11月和2021年6至7月首都医科大学口腔医学院正畸科采集的35 000张正畸临床图像, 图像全部来自于490例正畸治疗患者, 男女性别比例为49∶51, 年龄范围为4～45岁。根据纳入及排除标准进行数据清洗, 最终纳入数据集中的图像数据包括面像17 453张(包括正面像、正面微笑像、右侧90°面像、左侧90°面像、右侧45°面像和左侧45°面像)、口内像8 026张[包括正面像、右侧像、左侧像、上颌面像(原始)、上颌面像(翻转后)、下颌面像(原始)、下颌面像(翻转后)、覆覆盖像]、X线片4 115张[包括头颅侧位X线片(左侧)、头颅侧位X线片(右侧)、头颅正位X线片、曲面体层X线片以及手腕骨X线片]、其他非正畸图像684张。由正畸专业博士研究生、副主任医师、主任医师共同组成标注团队, 使用图像标注工具对正畸图像进行分类标注。图像类别包括6类面像、8类口内像、5类X线片以及其他图像, 共计20种分类标签。每个标签的数据按8∶1∶1的比例利用Pthyon计算机语言中的Random函数随机分为训练集、验证集和测试集, 使用改进的SqueezeNet网络(一种深度学习模型)进行训练, 使用ImageNet自然图片开源数据集中的13 000张作为额外的非正畸图像进行异常数据处理的算法优化, 构建基于深度学习模型的多分类正畸图像识别模型。根据测试集的预测结果, 利用精确率、召回率、F1分数以及混淆矩阵作为正畸图像分类准确性的指标, 评价该模型的预测能力。使用梯度加权分类激活映射方法生成热力图, 验证该模型进行图像分类判断逻辑的可靠性。结果通过数据清洗和标签标注, 共30 278张正畸图像纳入数据集。测试集分类结果显示, 多数分类标签的精确率、召回率以及F1分数为100%, 3 047张图像中仅5张分类错误, 模型精确率达99.84%(3 042/3 047)。而异常数据处理的精确率达100%(10 500/10 500)。热力图显示, 多分类正畸图像识别模型在图像分类过程中的判断依据与人类在判断该图像分类时基本一致。结论本项研究基于改进后的SqueezeNet网络构建了一种可用于20种正畸图像自动分类的多分类正畸图像识别模型, 该模型的图像分类准确性较好。

单位
首都医科大学

收藏分享被引浏览

更新时间：2024-03-19 04:12

基于深度学习的多分类正畸图像识别研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友