摘要
目的:探讨基于卷积神经网络(CNN)的数字病理学模型在肝癌复发预警中的预测价值。方法:本研究包含4个肝癌队列,队列1和队列3为训练集,队列2和队列4为验证集。队列1、2、3分别有202、179、738例患者,来源于2012年1月至2017年1月浙江大学医学院附属第一医院1 119例肝癌患者。队列4是来自美国的癌症基因组图谱(TCGA)数据库361例患者。首先,在队列1运用7种CNNs(AlexNet、Squeezenet、InceptionV3、GoogleNet、DenseNet201、VGG19和ResNet18)训练肝癌病理切片病灶自动识别模型,区分肿瘤区域与正常组织;选择最佳的神经网络模型,通过迁移学习构建肿瘤区域成分抽提模型,解析肿瘤区域5种不同成分(肿瘤细胞、淋巴细胞、间质、坏死及背景),并在队列2上验证;在队列3上探索这5种成分与肝癌术后复发的相关性,并联合临床特征构建肝癌术后复发预警模型,在队列4进行独立的外部验证。生存分析采用Kaplan-Meier法和Log-rank检验,生存预后影响因素分析采用LASSO-Cox比例风险回归模型。结果:在队列1中,AlexNet、DenseNet201、VGG19和ResNet18鉴别肝癌病灶的准确率均高于95.0%。在队列2中,神经网络VGG19的准确率最佳,达96.4%,选择VGG19迁移至肿瘤区域成分抽提模型,其分割5种成分的准确率达99.0%。在队列3中,多因素Cox分析显示,高淋巴细胞神经网络评分(LYM)和低间质神经网络评分(STR)与患者术后复发明显相关(HR=0.70,1.38;P<0.05);基于LYM、STR、AFP、美国癌症联合委员会(AJCC)分期构建术后复发风险的预警模型,在训练集和验证集中,模型可对患者术后复发风险精准分层(χ2=45.06,15.49;P<0.05)。在独立队列4中,肝癌复发预警模型进一步验证,LYM、STR病理特征综合评分可提高AJCC分期的无复发生存预测能力。结论:基于CNN的肝癌病灶自动识别模型和肿瘤区域成分抽提模型可智能化分割肝癌数字病理切片,实现肝癌术后复发预警,LYM、STR为术后复发相关的新型病理预测因子。
- 单位