摘要
目的建立联合多参数MRI前列腺影像报告与数据系统(PI-RADS)v2.1评分及临床数据的决策树、K近邻、朴素贝叶斯、随机森林、支持向量机5种机器学习模型,评价上述模型对前列腺癌的诊断价值。方法回顾性分析在本院接受MR检查并获得的病理结果的242例患者。将PI-RADS v2.1评分、年龄、总前列腺特异抗原、游离前列腺特异抗原、游离前列腺特异抗原比值、体积、前列腺特异抗原密度录入5种机器学习模型进行诊断。通过F1值及ROC曲线评价机器学习模型的诊断价值并且计算特征变量所占比重大小。结果随机森林模型诊断前列腺癌ROC的AUC最大(0.93),决策树及朴素贝叶斯模型AUC也较高(0.86、0.87),支持向量机最差(0.55);F1值最高的为随机森林模型,其次依序为朴素贝叶斯、决策树、K近邻,支持向量机模型最小。通过随机森林和决策树模型计算各特征变量重要性,PI-RADS评分均占比例最大,其次为前列腺特异抗原密度、前列腺体积,年龄对模型分类贡献最低。结论随机森林、朴素贝叶斯、决策树分类模型用于预测诊断前列腺癌具有更好的效果。随机森林方法在5种机器学习模型中最优,且PI-RADS v2.1及前列腺密度变量的特征重要性表现更明显。
- 单位