摘要
目的 基于机器学习算法建立、分析并筛选出理想的模型用于预测前列腺重复穿刺患者阳性率,以指导临床医师对患者重复穿刺的临床决策。方法 本研究回顾性分析自2008年1月至2022年12月期间来自多中心的281名连续接受至少两次以上前列腺活检且首次病理均为阴性的男性患者的临床资料。记录患者常规临床诊疗数据,包括BMI,两次穿刺记录的前列腺体积、PSA水平、fPSA/PSA比率、PSAD水平、穿刺后并发症、穿刺后病理学结果,以及两次前列腺穿刺采用的策略。统计分析比较最终病理阳性组与阴性组的参数差异情况。将参数分别通过多变量逻辑回归(LR)、K近邻搜索(KNN)、支持向量机(SVC)、决策树(DT)、随机森林分类器(RF)、朴素贝叶斯分类器(NBC)和梯度增强树(GB)7种机器学习算法模型进行训练拟合,将所有数据的70%作为训练集数据与30%的剩余验证集数据作6倍交叉验证,分析比较准确性和敏感性,采用受试者工作特征曲线评价各模型的诊断准确性,并最终评估其在预判前列腺癌第二次穿刺结果中的效果。结果 本组患者年龄32~87岁,平均69.03岁。最终穿刺病理中201例为阴性患者,80例确诊前列腺癌。组间比较显示第二次穿刺年龄、第二次穿刺前列腺体积、第二次穿刺PSA水平、第二次穿刺PSAD、第二次穿刺FPSA/PSA比率均有显著统计学差异(P<0.05)。将所有收集的数据随机分为两部分,70%(197例)前列腺穿刺患者用作训练数据集,剩余的30%(84例)患者用作验证数据集。结果显示在预测第二次前列腺穿刺结果方面,LR、KNN、SVC、DT、GNB、RF、GB的准确率波动于66.67%~74.88%;错误率波动于21.43%~34.29%;召回率波动于9.52%~47.62%;特异性波动于79.59%~97.96%;精确率波动于33.33%~80.00%。各模型的特异性分别为各个模型的ROC曲线下面积,波动于0.568~0.725。结论 SVC可以在较简单较少的参数下更准确地预测前列腺第二次穿刺的阳性情况。相对于其他算法模型,其使得预测结果拥有更好的灵敏性和特异性。通过更大样本量数据的收集和训练,其有潜力可以成为一项具有广泛配合度的预测前列腺第二次穿刺结果的检测工具。
-
单位唐都医院; 上海交通大学医学院附属第六人民医院; 上海市第八人民医院; 同济医院; 同济大学; 中国福利会国际和平妇幼保健院; 中国人民解放军空军军医大学; 西安交通大学第一附属医院