摘要
基于图的半监督学习凭借其直观性和良好的学习性能,在机器学习领域吸引了越来越多的关注。然而,通过分析发现,现有基于图的半监督学习方法存在对噪声/异常数据的鲁棒性不够好/较敏感的问题,此外,该方法具有较好性能的前提是训练数据与测试数据为独立同分布,导致在实际应用中存在一定的局限性。为解决上述问题,在某个再生核Hilbert空间,在充分考虑最小化噪声/异常数据影响的基础上,结合不同数据分布特点,基于结构风险最小化模型,提出一种基于可能性聚类假设的多模型适应学习方法。其主要思想为:(1) 通过模糊熵减弱噪声/异常数据对方法所带来的负面影响,(2) 综合考虑训练数据与测试数据在独立同分布和在独立不同分布时进行有效的多模适应学习,弱化训练数据和测试数据数据的独立同分布约束条件亦具有较好性能,(3) 给出了算法实现及其收敛性定理。在多个真实视觉数据集上分别进行了大量实验并进行深入分析,证实了所提方法具有优越的或可比较的鲁棒性和泛化性能。
-
单位哈尔滨工业大学; 电子信息工程学院; 航天学院; 宁波职业技术学院