摘要
目的探究CatBoost算法在青年人血压预测中的应用价值,为青年人高血压及高血压前期预警提供一种可行的技术手段。方法以2015—2017年期间在北京某医院体检中心进行健康体检的3872位青年人为研究对象,基于人口统计学和生活方式等指标,分别利用CatBoost算法构建收缩压预测模型和舒张压预测模型,然后利用模糊分类系统预测血压分级。使用线性回归、人工神经网络和SVM 3种机器学习算法分别构建血压预测模型,并与CatBoost模型进行比较分析。以均方根误差(root mean square error,RMSE)和平均绝对百分比误差(mean absolute percentage error, MAPE)作为模型的评价指标,并进一步分析模糊分类系统的预测效果。结果对于收缩压预测,基于CatBoost的模型在测试集上表现最优,RMSE和MAPE分别为11.17和7.18%。对于舒张压预测,基于CatBoost的模型在测试集上表现最优,RMSE和MAPE分别为9.04和9.29%。进一步的模糊分类也取得了较好的血压分类准确性。变量重要性分析表明,影响青年人血压值最重要的4个因素依次是年龄、身体质量指数(body mass index, BMI)、家族史和腰高比(waist-to-height ratio, WHtR)。结论 CatBoost算法在青年人血压预测中的应用具有一定的可行性,相比于其他传统算法,具有更好的预测能力。结合模糊分类系统,可以给用户较准确的血压分级预测。
- 单位