摘要

目的基于生物信息学方法探讨影响接受新辅助治疗(NAT)的人表皮生长因子受体2(HER2)阳性Ⅲ期乳腺癌患者预后的因素并构建预后预测模型。方法用美国国家癌症研究所监测、流行病学和最终结果(SEER)数据库*Stat 8.3.9软件收集2010年1月至2019年12月登记的接受新辅助治疗的HER2阳性Ⅲ期乳腺癌患者临床资料。获得患者一般资料和临床病理特征资料。使用R 4.2.1软件createDataPartition工具以7∶3将患者分为建模组和验证组。采用Cox比例风险模型分析乳腺癌患者特异性生存(BCSS)的影响因素, 并采用R 4.2.1软件survival包和rms包构建BCSS预测列线图模型。采用一致性指数(C指数)、受试者工作特征(ROC)曲线以及曲线下面积(AUC)、生存率校准曲线评估列线图模型的预测效能;采用X-tile软件计算与预后相关得分的最佳临界值, 采用Kaplan-Meier法绘制生存曲线。采用决策曲线分析(DCA)观察列线图模型的净收益。结果共纳入接受新辅助治疗的HER2阳性Ⅲ期乳腺癌患者1 790例, 按7∶3的比例随机分为建模组(1 250例)和验证组(540例), 两组患者一般资料比较, 差异均无统计学意义(均P>0.05)。多因素Cox回归分析结果显示, 未放疗、组织学分级Ⅲ~Ⅳ级、雌激素受体(ER)阴性、孕激素受体(PR)阴性、T4期、淋巴结转移率1%~30%、淋巴结转移率31%~60%、淋巴结转移率>61%是患者BCSS的独立危险因素(均P<0.05)。根据以上因素构建NAT的HER2阳性Ⅲ期乳腺癌预后列线图模型。经内部验证, 建模组C指数为0.732(95%CI 0.724~0.739), 验证组C指数为0.728(95%CI 0.721~0.737);建模组列线图模型预测3、6、9年BCSS率的AUC分别为0.724、0.719、0.775, 验证组分别为0.773、0.699、0.758;生存率校准曲线显示, 建模组和验证组3、6、9年BCSS率与实际观测的结果高度拟合。计算SEER数据库纳入患者列线图模型总得分, 预测预后的最佳临界值分别为80.0分和142.0分, 依此划分的低风险组(总分≤80.0分)、中风险组(总分>80.0分且≤142.0分)、高风险组(总分>142.0分)及根据美国癌症联合委员会(AJCC)分期分为ⅢA、ⅢB、ⅢC期患者BCSS比较, 差异均有统计学意义(均P<0.001), 且列线图模型风险分层区分BCSS效果更明显。DCA曲线显示, 与AJCC分期和两个极端治疗情况(完全治疗和完全不治疗)比较, 列线图模型预测NAT的HER2阳性Ⅲ期乳腺癌的BCSS有更高的净收益。结论影响接受NAT的HER2阳性Ⅲ期乳腺癌患者的预后因素为是否放疗、组织学分级、ER状态、PR状态、T分期、淋巴结转移率。构建的列线图模型预测BCSS的效能较好, 较传统AJCC分期有更大收益。