预测ER弱阳性乳腺癌状态的机器学习模型的建立及验证

徐梓航; 牛淑瑶; 沈荣波; 贾占莉; 商久妍; 王新乐; 张硕; 刘月平<sup>*</sup>

doi:10.13315/j.cnki.cjcep.2023.07.004

摘要

目的探讨利用机器学习算法预测ER弱阳性乳腺癌的状态。方法收集710例原发性浸润性乳腺癌，其中139例ER阴性(<1%)和311例ER阳性(>10%)乳腺癌作为训练队列，260例ER弱阳性(1%～10%)乳腺癌作为测试队列。深度学习分割模型(LinkNet)用于分割并提取肿瘤细胞的形态特征。基于朴素贝叶斯机器学习算法，利用从训练队列中提取的12个临床病理特征和14个形态特征开发机器学习预测模型，并进行内部验证。利用ROC曲线的曲线下面积(AUC)反映预测模型的性能。利用预测模型对测试队列进行ER状态预测。对比分析两组的临床病理特征、ESR1 mRNA的表达水平和预后。结果 ER阴性与ER阳性乳腺癌在组织学类型(P=0.01)、淋巴结转移(P=0.02)、组织学分级(P<0.001)、PR(P<0.001)、HER2(P<0.001)和Ki-67(P<0.001)表达差异有显著性。基于朴素贝叶斯机器学习算法构建预测模型，5倍交叉验证显示，在训练队列中预测模型对ER状态的预测性能优异(AUC=0.91±0.03)。ER状态预测结果显示，260例ER弱阳性乳腺癌中206例(79.23%)被划分为阴性组，54例(20.77%)被划分为阳性组。与ER阳性组相比，ER阴性组组织学分级更高、Ki-67高表达、ESR1 mRNA表达水平低，内分泌治疗获益更少，患者预后更差。结论机器学习模型能够较为精准地对乳腺癌ER表达状态进行预测，为进一步明确ER弱阳性乳腺癌的状态提供了新视角，协助临床医师做出更为精准的治疗决策。

单位
河北医科大学; 河北医科大学第四医院; 基础医学院; 腾讯

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 17:24

预测ER弱阳性乳腺癌状态的机器学习模型的建立及验证

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友