摘要

粒计算是一种符合人类认知特性的计算范式,能够有效处理复杂数据.随机森林通过集成多个决策树来降低单个决策树的过拟合风险,但仍存在一定的过拟合问题.为了减少过拟合并提高分类性能,本研究在随机森林中引入了粒向量表示,提出了基于粒向量的随机森林分类算法.粒向量具有表示高维特征的能力,可以捕捉更多的数据模式;参照样本选择的随机性有助于控制过拟合;不同决策树使用不同的粒向量可以增加模型的多样性.实验结果表明,与传统随机森林以及其他改进算法相比,基于粒向量表示的随机森林算法具有较好的泛化能力,有效提高了分类的准确率,表明了基于粒向量的随机森林分类算法的正确性与有效性.