基于深度卷积神经网络的Barrett食管内镜图片分类模型的建立

作者:林嘉希; 汪盛嘉; 赵鑫; 高欣; 殷民月; 朱锦舟*
来源:上海交通大学学报 (医学版), 2022, 42(05): 653-659.
DOI:10.3969/j.issn.1674-8115.2022.05.014

摘要

目的·利用深度卷积神经网络算法,构建Barrett食管内镜图片分类模型并评估其分类能力。方法·收集苏州大学附属第一医院消化内镜中心及Hyper Kvasir数据库中的内镜下食管图片共806张,其中正常食管图片412张、Barrett食管图片394张。随机将所有图片分为训练集(85%)与验证集(15%)。利用于Image Net数据库进行预训练的4种深度卷积神经网络[Xception、NASNet Large (NASNet L)、Res Net50V2 (Res Net)及Big Transfer (Bi T)],分别在训练集中进行迁移学习,建立Barrett食管内镜图片分类模型,并使用梯度加权分类激活映射对该4个模型的分类结果进行可视化解释。随后,于验证集中评价模型的分类能力。同时,收集高、低年资医师对验证集数据的分类结果,将其与模型的分类结果进行对比,进一步评估模型的分类能力。结果·成功构建了基于深度卷积神经网络的Barrett食管内镜图片的4个分类模型。利用梯度加权分类激活映射,以热力图形式实现了对模型分类结果的可视化解释。在验证集数据中,各模型均拥有较高的分类准确性与精确性,其平均分类准确性为0.852,平均分类精确性为0.846。NASNet L模型相较其余3种模型,拥有最高分类准确性(0.873)及最高分类精确性(0.867),是表现最优的模型。该模型对Barrett食管内镜图片的分类能力近似高年资医师,其分类准确性略低于高年资医师(0.881)而高于低年资医师(0.855);同时,该模型与高年资医师(Kappa=0.712,P=0.000)、低年资医师(Kappa=0.695,P=0.000)均具有较好的分类一致性。结论·利用深度卷积神经网络迁移学习构建的Barrett食管内镜图片分类模型具有较好的分类能力。

  • 单位
    苏州大学附属第一医院

全文