摘要

如何确定高维数据的固有维数是降维成功与否的关键。基于极大似然估计(MLE)的维数估计方法是一种新近出现的方法,实现简单,选择合适的近邻能取得不错的结果。但当近邻数过小或过大时,均有比较明显的偏差。其根本原因是没有考虑每个点对固有维数的不同贡献。在充分考虑数据集的分布信息之后,提出了一种改进的MLE——自适应极大似然估计(AMLE)。实验表明,无论在合成数据集还是真实数据集上,AMLE较MLE在估计准确度上均有很大的提高,对近邻数的变化也不甚敏感。

  • 单位
    枣庄科技职业学院; 无锡科技职业学院; 南京审计大学; 江南大学