摘要
为解决集成学习算法处理多来源数据集时运算难度大、分类准确率低等问题,提出基于频繁模式树的多来源数据选择性集成算法。比较数据源数据和真值间差异,利用拉依达准则判断多来源数据误差,同时提取多来源数据全部频繁模式,将其转换为压缩形式,创建频繁模式树架构,融合动态选择理念,运用目前数据测试实例从属某个被错误分类数据子集程度,凭借程度多少给予基分类器恰当权重;通过加权调和平均度量调整基分类器间的差异性与准确性,归一化处理频繁项集,最终采用精度高且和其他基分类器差异性大的基分类器组合完成多来源数据选择性集成。仿真结果表明,本文集成学习算法拥有更优的泛化性能和运行效率,分类正确率高。
-
单位国防大学