基于深度迁移学习的肺癌病理诊断

作者:赵丹; 车南颖; 宋志刚; 刘灿城; 王朗; 石怀银; 董宇杰; 林海峰; 穆晶; 英兰; 杨庆婵; 高亚南; 陈玮姗; 王书浩; 徐葳; 金木兰*
来源:中华病理学杂志, 2020, 49(11).

摘要

目的探索建立基于深度迁移学习的人工智能肺癌辅助诊断系统并评估其应用价值。方法收集2016至2019年之间首都医科大学附属北京胸科医院保存的519例肺部组织切片(包括正常肺、腺癌、鳞状细胞癌和小细胞癌), 扫描成数字切片, 分为316张训练集和203张内部测试集。训练集由病理医师进行标注, 使用基于ResNet-50的DeepLab v3图像分割模型建立肺部癌区像素级识别模型。在模型训练过程中, 将胃部癌区识别模型的参数作为初始值, 通过迁移学习策略对肺部癌区识别模型参数进行二次训练优化。再分别利用首都医科大学附属北京胸科医院的203张内部测试集以及从美国癌症影像档案(TCIA)数据库获得的1 081张外部测试集对已建立的辅助诊断模型进行验证。结果在较少样本量的情况下, 迁移学习模型比普通模型显示出更好的识别准确度[曲线下面积(AUC)值0.988∶0.971, Kappa值0.852∶0.832]。此外, 对外部测试集, 该研究建立的迁移学习模型诊断AUC值为0.968, Kappa=0.828, 表示该模型具有很好的推广性。结论该研究建立的人工智能肺癌病理辅助诊断方法具有较好的准确性和外部推广性。随着病理人工智能研究的不断深入, 迁移学习方法有助于缩短诊断模型训练周期, 提高诊断模型的准确性。

  • 单位
    解放军总医院; 清华大学; 首都医科大学附属北京朝阳医院; 北京市结核病胸部肿瘤研究所; 福建医科大学附属泉州第一医院; 天津市海河医院; 首都医科大学附属北京胸科医院; 内蒙古自治区第四医院