摘要

针对传统距离度量在高维数据上效果不明显问题,提出一种共享最近邻子空间聚类算法(SNNSC),按照维把数据集转变为多个最近邻事务数据库,挖掘事务数据库中最大共现对象集,即一维上聚类。在一维聚类集上进一步挖掘闭频繁项集,包含闭频繁项集的维是子空间,闭频繁项集是子空间上聚类。实验对比结果表明,SNNSC能够更准确定位子空间,并在子空间上产生完整聚类。