摘要

目的探讨基于治疗前胸部平扫CT影像组学特征和临床特征结合机器学习算法预测非小细胞肺癌(NSCLC)患者表皮生长因子受体(EGFR)突变状态和突变亚型(19Del/21L858R)的可行性和价值。方法回顾性分析南华大学附属第一医院和附属第二医院经活检病理证实和接受EGFR基因检测的280例NSCLC患者的治疗前胸部平扫CT和临床特征数据, 其中EFGR突变患者为136例。由两位高年资影像和肿瘤医师勾画原发肺部大体肿瘤区域(GTV), 然后提取851个影像组学特征, 采用Spearman相关分析和RELIEFF算法筛选具有预测性的特征, 两家医院分别为训练组和验证组。经特征选择的影像组学特征和临床特征构建临床-影像组学模型, 并与单独采用影像组学特征和临床特征模型进行比较。采用序贯建模流程, 使用支持向量机(SVM)建立机器学习模型预测EGFR突变状态和突变亚型。受试者工作曲线下面积(AUC-ROC)评估预测模型的诊断效能。结果经特征筛选各有21个影像组学特征在预测EGFR突变和突变亚型时具有预测效能并用于建立影像组学模型。临床-影像组学模型表现出最好的预测效能, 预测EGFR突变状态的模型AUC在训练组为0.956(95%CI:0.952~1.000)、验证组为0.961(95%CI:0.924~0.998), 预测19Del/21L858R突变亚型的AUC在训练组为0.926(95%CI:0.893~0.959)、验证组为0.938(95%CI:0.876~1.000)。结论基于治疗前CT影像组学和临床特征结合机器学习的序贯模型能够精准预测EGFR的突变状态和突变亚型。