摘要

复杂系统的实际过程数据具有多工况、高维度、多源多模态等异质特点,“大样本”中蕴含着“小样本”,其具有整体特征与局部特征。集成学习通过联合多个基学习器对复杂异质数据的内部规则进行提取,具有显著的数据挖掘优势,并已获得了广泛关注。针对集成学习的重要应用价值,对其研究进展与发展前景进行了综述和展望。首先,基于设计思想对集成学习的结构和性质进行了归纳总结;接着,通过特征工程、基学习器选取和集成策略3个方面对集成学习的研究现状展开了论述;然后,介绍了集成学习在复杂工业问题、图像识别、指标预测、信息安全和临床诊断等不同领域中的实际应用情况;最后,指出了当前研究面临的挑战并展望了未来的研究方向。

全文