摘要
针对最小二乘支持向量机(LSSVM)稀疏化问题,提出一种基于主动学习的LSSVM数据稀疏化学习算法。首先基于核聚类的方法选取初始样本,并利用LSSVM构建一个最小分类器,然后计算样本在分类器作用下的分布,选择最接近分类面的样本进行标记,最后将该标记样本加入训练集建立新的分类器,重复上述过程直到模型精度满足要求,以此建立部分样本的LSSVM稀疏化模型。利用加利福尼亚大学欧文分校(UCI)提供的6种数据集进行实验,结果表明,提出的方法使LSSVM的稀疏性提高了46%以上,减少了标注样本带来的成本。
- 单位