摘要
目的通过机器学习筛选肝细胞癌患者术前微血管侵犯(MVI)相关指标, 构建预测MVI的logistic回归模型并评估。方法回顾分析2018年1月至2023年3月宁夏医科大学总医院行根治性切除术的肝细胞癌患者临床资料。共入组437例患者, 其中男性325例, 女性112例, 年龄(56.3±13.6)岁。437例患者通过计算机产生随机数按7∶3分为训练集(n=305)和测试集(n=132), 训练集用于构建logistic回归模型并通过五折交叉验证法内部验证(验证集), 测试集用于外部验证。通过Boruta算法和LASSO回归两种机器学习算法筛选MVI特征变量, 并构建logistic回归模型。受试者工作特征(ROC)曲线、校准曲线、决策曲线评估模型, Shapley加法解释(SHAP)分析关键变量的重要性。结果取Boruta算法筛选的8个特征变量和LASSO回归筛选的8个变量的交集(5个变量):天冬氨酸氨基转移酶/淋巴细胞比值(ALR)、肿瘤边缘、瘤内坏死、肿瘤数目、肿瘤最大径, 构建logistic回归模型。该模型预测MVI的ROC曲线下面积为0.77(95%CI:0.70~0.82)(训练集)、0.76(95%CI:0.63~0.87)(验证集)、0.84(95%CI:0.78~0.91)(测试集)。校准曲线logistic回归模型的预测结果与实际结果接近, 决策曲线分析提示模型具有较好的临床应用价值。按平均绝对SHAP值进行重要性递减排序依次为肿瘤边缘、肿瘤最大径、肿瘤数目、ALR、瘤内坏死。结论肿瘤边缘、肿瘤最大径、肿瘤数目、ALR、瘤内坏死是肝细胞癌伴有MVI的独立影响因素, 基于上述因素构建的预测MVI的logistic回归模型预测效能良好。
-
单位宁夏回族自治区人民医院; 宁夏医科大学; 宁夏医科大学总医院