摘要
目的:为了方便、快速、高效地预测大学生体质健康状况。方法:按照我国六大行政区划,在全国范围内选取12所高等院校,筛选在校男性大学生共计104 530名的体质健康测试数据,基于互信息量与机器学习决策树方法,研究了大学生体质健康状况预测精度。结果:不同特征对于体质健康状况预测贡献度具有明显差异;其中,七特征组合“1 000米+引体向上+立定跳远+50米+坐位体前屈+体重+肺活量”对于体质健康状况的预测效果最好,预测精度可达95.0%。与粗略决策树、中等决策树、精细决策树相比,优化决策树对于体质健康状况的预测效果最好,预测精度可达95.1%。对于三种分类规则,最大程度减少偏差分类规则对于体质健康状况预测效果最好;对于不同替代决策分裂类型,关闭、打开、全部搜索状态对于体质健康预测效果未有明显区别。对于贝叶斯、网格搜索、随机搜索三种优化器而言,在各优化器下均有一种超参数组合和其他优化器下的最优超参数预测效果相当超参数组合。结论:优化决策树对于大学生体质健康状况相较于传统决策树有较好的预测效果。
- 单位