基于group lasso logistic回归的6月龄婴儿贫血预测模型的构建

作者:张啸; 赵薇; 胡焕青; 黄爱群; 陈大方*
来源:中国慢性病预防与控制, 2020, 28(03): 199-205.
DOI:10.16386/j.cjpccd.issn.1004-6194.2020.03.009

摘要

目的构建6月龄婴儿中度贫血的预测模型,为婴儿贫血的预防和控制提供更好的指导。方法于2015年9月至2019年6月,基于方便抽样,选择在河北省石家庄市正定县、辽宁省鞍山市立山区、湖南省岳阳市岳阳县以及厦门市海沧区和集美区生活的2 431名孕晚期孕妇进行问卷调查,并对其分娩的婴儿进行随访观察。采用SAS 9.4软件进行数据描述和χ2检验。使用R 3.6.1软件拟合全变量进行group lasso logistic回归,筛选6月龄婴儿中度贫血的影响因素及构建预测模型,并绘制受试者工作特征(ROC)曲线,计算灵敏度、特异度和曲线下面积(AUC)评价模型的预测效果。结果 2 431名6月龄婴儿中,总贫血率为24.60%,轻度贫血率为22.46%,中度贫血率为2.14%。以中度贫血为结局,最终筛选出11项有意义的指标,分别为低出生体重、分娩方式、维生素D摄入情况、当前母乳喂养、最近两周是否感冒、婴儿贫血史、母亲教育程度、孕中晚期是否吃牛(羊)肉、孕中晚期是否吃鸡(鸭)等禽类肉、孕中晚期是否吃海带(紫菜)等海产品和地区。模型的AUC值为0.783 2(95%CI:0.722 8~0.843 5),若取阈值为1.77%,则灵敏度为90.38%,特异度为45.65%。结论采用group lasso logistic回归构建的预测模型具有较好的预测能力,当阈值为1.77%时,能较好地发现6月龄婴儿中度贫血的高危人群。

  • 单位
    公共卫生学院; 中国疾病预防控制中心妇幼保健中心; 北京大学