基于机器学习的子痫前期预测模型构建

作者:陈梓威; 陈治任; 黄泽花; 曹岩; 王涵; 王培安*
来源:徐州医科大学学报, 2023, 43(08): 571-576.
DOI:10.3969/j.issn.2096-3882.2023.08.005

摘要

目的 采用CatBoost算法和逻辑回归(LR)算法构建子痫前期预测模型,以期为子痫前期高风险人群的早期防治提供参考。方法 选取2012年1月—2021年12月于徐州市中心医院进行产检及分娩的孕产妇1 325例作为研究对象,其中研究组为患有子痫前期的孕产妇461例,对照组为随机抽取的同期正常妊娠的孕产妇864例。收集孕产妇住院期间的体格检查、人口学特征以及血常规、尿常规和生化指标等资料进行回顾性分析,通过统计学分析筛选导致子痫前期发生的独立影响因素。纳入独立影响因素,通过网格搜索法寻找LR算法和CatBoost算法的最优参数构建预测模型,并对模型进行预测效果评价。结果 当C=100,penalty=“l2”,solver=“liblinear”时,LR模型达到最佳效果,AUC=0.976 9,准确度=0.944 7,精确度=0.959 0,召回率=0.873 1,F1=0.914 1。当depth=5,iterations=500,l2_leaf_reg=1,learning_rate=0.1,rsm=0.5时,CatBoost模型达到最佳效果,其AUC=0.983 0,准确度=0.952 3,精确度=0.967 5,召回率=0.888 1,F1=0.926 1。结论 2种风险预测模型在预测性能上都有较好的表现,可以有效预测子痫前期的发生,有早期识别子痫前期的潜在应用价值。

全文