摘要
目的:评价基于FP-Growth和Apriori算法的机器学习(machine learning, ML)联合基于Logistic回归分析的医学统计技术在直肠癌患者死亡风险预测中应用的可行性和价值。方法:筛选2008年01月至2018年01月间于我院接受诊疗的青壮年直肠癌患者1 704例,包含5年内死亡患者324例(19.01%),收集其资料进行前瞻性研究。编制FP-Growth和Apriori算法程序,通过ML计算死亡患者基线资料间有效强关联规则。对全部患者行Logistic回归分析导致死亡的独立风险因素。参考医学统计预测结果来验证ML应用的可行性,评价ML联合医学统计的应用价值。结果:通过ML计算获得死亡患者基线资料间有效强关联规则9项,其前项包括:年龄(50~59岁)、性别(男)、癌胚抗原(carcinoembryonic antigen, CEA)(≥5μg/L)、肿瘤大小(>5 cm3)、组织学分化程度(低分化)、N分期(N2)、远端转移灶数目(≥3个)、手术(远端转移灶手术)。除缺失“Stage分期”和“转移淋巴结数目”外,ML同医学统计预测结果高度一致。在ML的应用具有一定可行性和可操作性基础上,联合医学统计使得预测结果更具逻辑性。结论:ML联合医学统计可用于预测青壮年直肠癌患者的死亡风险,具有一定应用和推广价值。
-
单位河北北方学院附属第一医院