摘要
本发明公开了一种核范数驱动的数据分类方法及系统,该方法包括:首先利用训练集中的样本构造权重系数矩阵,用于表征样本间的相似性,再初始化一个初始类别矩阵;其次,为了准确可靠地度量近邻重构误差,采用了核范数来度量流形平滑项,在优化过程中,基于核范数的近邻重构误差最小化问题可转化成求解一系列Frobenius范数的优化问题,同时,在度量预测标签与人工初始标签之间的差异的过程中,为了提升模型对于噪音的鲁棒性和度量的准确性,提出基于加权L2,1范数的标签拟合项。最后,取软类别标签向量中概率值最大项用于类别鉴定,得到最准确的分类结果。此外,使用核范数作为距离度量比L1范数或L2范数更可靠,有效提升了模型的预测精准度。
- 单位