摘要
[背景]尘肺病的人工诊断受到多种因素的影响,容易出现漏诊误诊情况。人工智能在医学影像领域的发展十分迅速,考虑能否利用人工智能实现对尘肺病影像的读片。[目的]基于深度卷积神经网络的方法构建三种深度学习模型,进行尘肺病有无的诊断。评价三种模型诊断效能并进行对比,挑选出最优的模型。[方法]收集7家医院在2017年6月—2020年12月拍摄的数字X线摄影(DR)胸片并对胸片进行质量控制。收集的DR胸片中尘肺诊断阳性为阳性组,无尘肺胸片为阴性组。由通过阅片考核的专家对收集胸片进行标注,标注过程中不断进行基于最大期望算法的一致性考核。标注后的数据经数据清洗、数据归档、预处理后纳入训练集和验证集。构建TMNet、ResNet-50和ResNeXt-50三种深度卷积神经网络模型,采用十折交叉验证法对模型进行训练,得到最优的模型。收集未纳入训练集和验证集的500例DR胸片,经由5位资深专家共同鉴定作为金标准成为测试集。通过测试,得到三种模型的准确率、灵敏度、特异度、受试者工作特征曲线下面积(AUC)等指标,评价三种模型性能并进行对比。[结果]本研究共收集训练集与验证集DR胸片24 867张,其中阳性组6 978例,阴性组17 889例。收集胸片中肺部异常情况如气胸、肺结核等共有312例。共有9名专家对胸片进行了标注,尘肺异常(不分期)的标注一致性率均在88%以上,尘肺分期的标注一致性率从84.68%到93.66%不等。TMNet的诊断准确率为95.20%,灵敏度达到99.66%,特异度为88.61%,AUC值为0.987。Res Ne Xt的诊断准确率为87.00%,灵敏度达到89.93%,特异度为82.67%,AUC值为0.911。Res Net的诊断准确率为84.00%,灵敏度达到85.91%,特异度为81.19%,AUC值为0.912。TMNet模型的上述指标均高于Res Ne Xt-50和Res Net-50模型。TMNet与另外两个模型AUC差值的差异有统计学意义(P <0.001)。[结论]三种卷积神经网络模型均可有效诊断尘肺病的有无,其中TMNet的效能最好。
-
单位华北理工大学; 公共卫生学院