摘要
目的评价C5.0决策树模型预测高脂血症的效果,为高脂血症预防及早期干预提供依据。方法选取2019年8月―2020年7月浙江大学医学院附属杭州市第一人民医院的体检人群为调查对象。通过查阅体检人群的健康管理档案收集人口学情况、体格检查、实验室指标和生活行为方式资料。采用C5.0算法决策树模型分别建立个人水平模型和临床模型预测高脂血症,计算准确率、Kappa值和绘制受试者工作特征曲线(ROC)评价预测效果。结果共纳入382人,高脂血症232例,占70.73%。个人水平模型预测因素预测精度由高到低依次为高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为84.16%,最低为63.44%。临床模型预测因素预测精度由高到低依次为谷丙转氨酶、谷草转氨酶、空腹血糖、血压、总胆红素、高密度脂蛋白、高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为91.63%,最低为82.38%。个人水平模型训练样本和测试样本的预测准确率分别为80.20%和82.02%;临床模型训练样本和测试样本的预测准确率分别为91.13%和88.76%。个人水平模型的Kappa值为0.623;临床模型的Kappa值为0.803。个人水平模型训练样本和测试样本的AUC值分别为0.824和0.836,均小于临床模型的0.909和0.887 (均P<0.05)。结论 C5.0算法建立决策树模型对体检人群中隐匿性高脂血症患者具有较好的预测效果,可在临床应用推广。
- 单位