摘要

目的:对来自两个不同中心的18F-FDG正电子发射体层成像(positronemissiontomography,PET)/计算机体层成像(computed tomography,CT)影像进行影像组学分析,以预测肺腺癌表皮生长因子受体(epidermal growth factor receptor,EGFR)突变状态为任务,探究不同的多中心数据处理方式对特征稳定性和预测能力的影响,并寻找对多中心影像数据合适的处理方式。方法:对148例来自两个独立中心的非小细胞肺癌患者的PET/CT影像进行回顾性分析,这些影像采用不同的扫描设备,CT断层间隔分别为3和5 mm。在PET/CT影像上勾画感兴趣区(region of interest,ROI),对CT影像分别采用灰度范围归一化、降采样、插值升采样进行预处理后,提取、筛选影像组学特征,建立logistic回归(logistic regression,LR)模型。特征的稳定性通过统计学显著性检验的P值衡量。采用受试者工作特征(receiver operating characteristic,ROC)曲线评价模型效能,用来评估特征对EGFR突变状态的预测能力。结果:采用的3种图像预处理方法都能提升影像组学特征的稳定性,使用灰度范围归一化和降采样组合的方法效果最好,相比于基线能够多保留30.8%的特征,其对应特征的预测能力也最佳,构建的LR分类器在训练和测试集上曲线下面积(area under curve,AUC)分别为0.862和0.716。结论:灰度范围归一化配合降采样是有效的多中心影像预处理手段,能够提高影像组学特征的稳定性和预测效能。

全文