摘要

目的使用数据挖掘技术建立肺癌危险度预测模型,比较C5.0决策树与人工神经网络用于肺癌风险预测的性能,并探讨其在肺癌风险预测中的价值。方法选择180例肺癌患者及240例肺良性疾病患者,收集肺癌相关危险因素和临床症状共17个自变量,建立C5.0决策树与人工神经网络模型,比较模型的预测性能。结果共收集420份病历资料,将所有样本按7:3随机分为训练集样本和测试集样本。人工神经网络模型的测试集准确度为65.3%、敏感度为61.7%、特异性为73.3%、约登指数为0.350、阳性预测值为54.9%、阴性预测值为73.1%、AUC为0.675(95%CI:0.628~0.720)。C5.0决策树模型的测试集准确度为61.0%、敏感度为47.8%、特异性80.4%、约登指数为0.282、阳性预测值为35.3%、阴性预测值为80.6%、AUC为0.641(95%CI:0.593~0.687)。结论人工神经网络模型整体性能优于C5.0决策树,在肺癌危险度的预测中具有潜在的应用价值。