摘要
目的:利用机器学习的方法建立并验证肝细胞癌(HCC)的多指标联合诊断模型,为肝癌的早期诊断提供新途径。方法:选取医院收治的102例原发性HCC患者临床信息及血清检测资料纳入HCC组,将收集的416例非HCC患者临床信息及血清检测资料纳入非HCC组,非HCC组患者中包括199例其他肿瘤患者、117例良性肝病患者和100名健康体检者,运用机器学习中的逻辑回归、支持向量机、随机森林和深度神经网络4种模型,分别构建包含性别、年龄、甲胎蛋白(AFP)、甲胎蛋白异质体比率(AFP-L3%)和脱-γ-羧基凝血酶原(DCP)5个指标的4种肝癌诊断模型。通过独立样本库对4种模型进行外部验证,采用受试者工作特征(ROC)曲线下面积(AUC)比较单一标志物和多指标模型对肝癌的诊断效能。结果:逻辑回归、支持向量机、随机森林和深度神经网络4种模型对HCC诊断效能的AUC分别为0.919、0.868、0.866和0.854,均显著优于单一标志物AFP(0.747)、AFP-L3%(0.746)和DCP(0.823);且逻辑回归模型对HCC诊断效能的AUC为0.919,显著优于支持向量机(0.868)、随机森林(0.866)和深度神经网络(0.854)3种模型。在外部验证中,逻辑回归模型对HCC诊断的灵敏度为77.3%,特异度为94.5%。结论:利用机器学习模型整合多项指标可有效提升HCC的诊断效能,为HCC的血清学诊断提供新的思路。
-
单位重庆市中医院; 中国医学科学院北京协和医院