摘要

针对数据挖掘过程中边界信息分类精度较低且容易出现误分类的问题,提出了一种面向大数据的边界信息分类算法。从最小贝叶斯规则出发,首先采用三支决策规则对数据样本进行划分,然后通过Bagging集成学习对划分后的边界数据进行分类器训练,得到多个弱分类器,最后通过对基学习器加权投票输出投票结果,实现边界信息的正确划分。通过对多个数据集进行实验表明,该方法不仅能提高边界信息数据的分类精度,还能进一步降低边界数据的误分类风险。

  • 单位
    河南工业贸易职业学院