摘要

为了提升标记分布学习在歧义性分类问题上的预测性能,对标记形态上的模糊度进行研究。提出了标记形态模糊度的概念,给出了基于峰度的一种度量方式,探讨了不同模糊程度样本对于分类学习的影响。根据低模糊度数据更有利于学习的研究发现,基于加权低模糊度样本和对齐模糊度损失这两种策略设计了一种新的标记分布学习算法。14个数据集上的十折交叉试验表明,该文提出的标记分布学习模糊度量化标记算法在各种数据集上都能够降低模糊度损失并提升预测精度,具有良好的鲁棒性。

全文