摘要

最小二乘回归子空间聚类算法存在对数据中噪声敏感、模型对数据结构信息约束不充分、没有考虑数据非线性关系等问题。针对这些问题,提出一种基于log函数的改进算法。使用L-(2,log)范数代替Frobenius范数约束残差项,提高算法的鲁棒性;使用logdet范数代替Frobenius范数约束表达矩阵,加强表达矩阵的低秩性;利用核方法处理数据,增强算法对数据非线性关系的捕捉能力,进而提高聚类的准确率。分别在人脸、手写数字、物体3种类别的数据集上与多个经典聚类算法进行对比试验,试验结果表明,该算法在精准度、标准化互信息、纯度3个聚类评价指标上优于对比算法,具有良好的聚类效果。