围产期抑郁症辅助诊断预测模型的构建及机器学习算法的筛选

王妤; 褚嘉栋; 孙娜; 韩嫱; 沈月平; 周磊; 朱新平; 张晓斌; 杨勇<sup>*</sup>

摘要

目的基于机器学习(ML)算法构建孕产妇围产期抑郁症(PND)辅助诊断预测模型并评估不同ML算法模型的性能。方法采用9条目患者健康问卷抑郁量表(PHQ-9)对5 814例孕产妇(产前研究对象4 665例，产后研究对象1 149例)进行评估，收集7种量表的19个量表维度变量和人口学特征作为观察变量。按照年龄分别对产前、产后研究对象进行1∶1倾向性评分匹配，利用单因素分析及Pearson相关系数确定特征选择变量。基于Logistic回归模型、随机森林(RF)、支持向量机(SVM)、极限梯度提升树(XGBoost)、反向传播(BP)神经网络这5种ML算法分别纳入所有变量和特征选择变量集，构建产前、产后抑郁的诊断模型。采用5折交叉验证方法评估模型的预测性能，评价指标包括灵敏度、特异度和曲线下面积(AUC)。结果纳入不同变量的情况下，通过5种ML算法分别基于产前研究对象、产后研究对象构建的预测模型的灵敏度、特异度、AUC均在0.600～0.900范围内；RF算法在产前预测模型(纳入所有变量时，AUC为0.834;纳入特征选择变量集时，AUC为0.849)和产后预测模型(纳入所有变量时，AUC为0.873;纳入特征选择变量集时，AUC为0.864)的构建中均为最优算法。结论基于5种ML算法构建的预测模型均可有效预测孕产妇PND风险，其中以RF算法的表现最优，为开发快速筛查和诊断PND的辅助工具提供了参考依据。

单位
苏州市广济医院; 苏州大学; 公共卫生学院

收藏分享被引浏览

更新时间：2024-03-15 16:28

围产期抑郁症辅助诊断预测模型的构建及机器学习算法的筛选

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友