摘要

为了通过众多的医学指标更准确地预测血糖值,将运用主成分分析耦合GBDT做回归·首先运用主成分分析将39个原指标综合成18个新指标,并对这18个累积贡献率达95%的新指标做变量特征重要性分析,再结合18个新指标运用GBDT做回归.其中有关血糖值的数据来源于天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测.将含有5642个样本值的一组血糖值数据按照7:3的比例分成两组,分别称为训练集和测试集,运用训练集中的数据建立回归模型,得出回归模型的均方根误差为0.0053,再利用测试集中的数据预测血糖值,并与测试集中的真实值作比较,得出均方根误差为0.0063,这说明预测出的血糖值较为准确,能够保障血糖值预测的精度.