摘要

目的尝试构建1个基于深度学习的内镜超声检查(endoscopic ultrasonography, EUS)质量控制系统, 并验证其价值。方法从武汉大学人民医院消化内镜中心数据库中, 回顾性收集2016年12月—2019年12月间的269个EUS检查资料, 分为:(1)用于训练模型的训练数据集A, 包含205个检查, 其中16 305张图像用于分类训练, 1 953张图像用于分割训练;(2)用于评估模型性能的测试数据集B, 包含44个检查, 其中1 606张图像用于分类验证, 480张图像用于分割验证;(3)用于内镜医师与模型进行比较的数据集C, 包含20个检查, 共150张图像。EUS专家(具有10年以上的EUS操作经验)甲和乙通过讨论对训练集A和测试集B、C的所有图像进行分类和标注, 其结果用作金标准。EUS专家丙和高年资EUS医师(具有5年以上的EUS操作经验)丁、戊对数据集C中的图像进行分类和标注, 其结果用于与深度学习模型进行比较。主要观察指标包括分类的准确率、分割的Dice(F1指数)和一致性分析的Kappa系数。结果在测试数据集B中, 模型分类的平均准确率为94.1%, 胰腺分割的平均Dice为0.826, 血管分割的平均Dice为0.841。在数据集C中, 模型的分类准确率达到90.0%, 专家丙、高年资医师丁和戊分别为89.3%、88.7%和87.3%;模型的胰腺和血管分割Dice系数分别为0.740和0.859, 专家丙分别为0.708和0.778, 高年资医师丁分别为0.747和0.875, 高年资医师戊分别为0.774和0.789, 模型与专家的水平相当。一致性分析结果显示, 模型与内镜医师之间达成了较好的一致性(Kappa系数分别为:模型与专家丙间0.823、模型与高年资医师丁间0.840、模型与高年资医师戊间0.799)。结论基于深度学习的EUS分站和胰腺分割识别系统可以用于胰腺EUS的质量控制, 具有与EUS专家相当的分类和分割识别水平。

  • 单位
    武汉大学人民医院