摘要
针对传统数据库统计方式难以实现学生体测数据内在关系的挖掘和横向比对,提出一种改进的C4.5决策树算法,通过改进的信息熵和简化的函数关系来计算分裂信息度量,在保证预测结果精度的前提下,去除连续属性数据中非必要划分点的信息增益率的计算量,提高算法的运行效率。基于MySQL数据库的在校大学生体测平台,将决策树算法内嵌于平台来执行数据的挖掘和处理,实现对大学生体测数据的规划化处理和内在关系的挖掘。实例验证结果表明,肺活量测试项目是影响大学生身体健康的最大因素,其中身高和体重成为造成肺活量测试失败的最大影响因素。
- 单位