摘要
近年来,机器学习的过拟合问题备受关注,尤其在属性约简中。为解决这一难题,提出一种融合集成策略和去除操作的算法。首先将训练模型数据平分为M份;然后将其中M-1份采用集成策略进行潜在约简计算;最后将剩余的一份进行提前测试,一旦发生过拟合则将刚加入的属性从潜在约简集中去除。利用提前测试潜在属性约简的方法来防止过拟合现象的发生,几组UCI数据的实验结果说明了新算法的有效性,同时为丰富和发展属性约简提供了一种新的方向。
-
单位宿迁学院