摘要
目的 基于乳腺癌电子病历系统收集的临床和病理特征数据构建机器学习模型,预测新辅助化疗(neoadjuvant chemotherapy,NAC)后的病理完全反应(pathological complete response,pCR)。方法 回顾性收集2015年1月至2020年12月在本院接受NAC治疗和手术切除的乳腺癌患者的临床信息。按7∶3的比例将患者随机分为训练集和验证集。在训练集中分别构建5个机器学习模型:Logistic回归(LR)、人工神经网络(artificial neural network,ANN)、简单贝叶斯(naive bayes,NB)、随机森林(random forest,RF)以及XGboost模型。采用受试者工作特征(receiver operating characteristic,ROC)曲线下面积(AUC)、准确性、敏感度和特异度评价机器学习的预测能力。结果 共742例患者纳入分析,其中训练集533例,验证集209例。经特征工程后,选择年龄、CA-15-3、ER状态、PR状态、HER2状态、Ki-67、T分期、N分期和NAC方案等特征构建预测模型。构建的5个机器学习模型中,XGboost模型的性能最高,在训练集和验证集中的AUC分别为0.850、0.834。结论 使用治疗前临床和病理特征并基于机器学习构建的XGboost模型在预测乳腺癌患者NAC后的pCR反应中具有良好效能,能为患者后续的治疗策略制定提供依据。
-
单位青岛市市立医院