基于数据密度的半监督自训练分类算法

作者:艾震鹏; 王振友
来源:计算机应用研究, 2019, 36(04): 1072-1074.
DOI:10.19734/j.issn.1001-3695.2017.12.0753

摘要

在实际的分类任务中,无标记样本数量充足而有标记样本数量稀少的情况经常出现,目前处理这种情况的常用方法是半监督自训练分类算法。提出了一种基于数据密度的半监督自训练分类算法,该算法首先依据数据的密度对数据集进行划分,从而确定数据的空间结构;然后再按照数据的空间结构对分类器进行自训练的迭代,最终得到一个新的分类器。在UCI中六个数据集上的实验结果表明,与三种监督学习算法以及其分别对应的自训练版本相比,提出的算法分类效果更好。

全文