摘要
针对自训练方法中局部噪声滤波器存在的参数依赖性以及仅使用标记数据来删除标记错误样本等局限性,提出了一种基于密度峰值和无参数局部噪声滤波器自训练方法。使用密度峰值聚类发现整个数据的潜在空间结构,其中每个样本在显示的结构中都有一个标记的顺序,使其更容易集成局部噪声滤波器;提出一种无参数依赖的自然领域剪辑滤波器,从而同时利用标记数据和未标记数据去除噪声;通过使用扩展的标记数据对分类器进行训练。实验结果验证了提出方法在标记数据不足的情况下仍能有效去除错误标记样本,并且能够得到分类精度较高的半监督分类器。
-
单位山西大同大学