预测ER弱阳性乳腺癌状态的机器学习模型的建立及验证

作者:徐梓航; 牛淑瑶; 沈荣波; 贾占莉; 商久妍; 王新乐; 张硕; 刘月平*
来源:临床与实验病理学杂志, 2023, 39(07): 782-787.
DOI:10.13315/j.cnki.cjcep.2023.07.004

摘要

目的 探讨利用机器学习算法预测ER弱阳性乳腺癌的状态。方法 收集710例原发性浸润性乳腺癌,其中139例ER阴性(<1%)和311例ER阳性(>10%)乳腺癌作为训练队列,260例ER弱阳性(1%~10%)乳腺癌作为测试队列。深度学习分割模型(LinkNet)用于分割并提取肿瘤细胞的形态特征。基于朴素贝叶斯机器学习算法,利用从训练队列中提取的12个临床病理特征和14个形态特征开发机器学习预测模型,并进行内部验证。利用ROC曲线的曲线下面积(AUC)反映预测模型的性能。利用预测模型对测试队列进行ER状态预测。对比分析两组的临床病理特征、ESR1 mRNA的表达水平和预后。结果 ER阴性与ER阳性乳腺癌在组织学类型(P=0.01)、淋巴结转移(P=0.02)、组织学分级(P<0.001)、PR(P<0.001)、HER2(P<0.001)和Ki-67(P<0.001)表达差异有显著性。基于朴素贝叶斯机器学习算法构建预测模型,5倍交叉验证显示,在训练队列中预测模型对ER状态的预测性能优异(AUC=0.91±0.03)。ER状态预测结果显示,260例ER弱阳性乳腺癌中206例(79.23%)被划分为阴性组,54例(20.77%)被划分为阳性组。与ER阳性组相比,ER阴性组组织学分级更高、Ki-67高表达、ESR1 mRNA表达水平低,内分泌治疗获益更少,患者预后更差。结论 机器学习模型能够较为精准地对乳腺癌ER表达状态进行预测,为进一步明确ER弱阳性乳腺癌的状态提供了新视角,协助临床医师做出更为精准的治疗决策。

全文