基于随机森林算法建立甲状腺功能减退患病风险预测模型

作者:杨正霞; 王和勇; 贺施琪; 刘城; 王天逸; 张圣辉; 毛晓健
来源:广州医药, 2023, 54(07): 16-24.
DOI:10.3969/j.issn.1000-8535.2023.07.003

摘要

目的 基于随机森林方法构建甲状腺功能减退(简称甲减)患病风险预测模型。方法 从MIMIC-Ⅳ数据库纳入5 735名甲减患者为病例组,4 803名非甲减患者为对照组,基于随机森林模型进行建模。同时利用逻辑回归、贝叶斯正则化神经网络、XGBoost作为比较模型。最后用准确率、F1分数、精确率、召回率、特异性以及AUC值评价四个机器学习模型性能。结果 随机森林模型准确率为0.85,F1分数为0.84,精确率为0.84,召回率为0.84,特异性为0.86,AUC值为0.91。在该模型中,促甲状腺激素、年龄、绝对淋巴细胞计数、血液中红细胞数、中性白细胞、性别、碱性磷酸酶、丙氨酸氨基转移酶、嗜酸性粒细胞绝对计数、尿素氮为甲减患者诊断重要性排前10的指标。结论 采用随机森林方法构建的甲减患病预测模型为甲减的早期诊断有潜在应用价值。

全文