摘要

综述了离群数据(outliers)探测是数据挖掘和知识发现的一项重要任务及其在天文学中兴起的必然性。简要介绍了离群数据的定义、特点、产生原因及影响,着重阐述了探测-维离群数据和多维离群数据的方法,并且与一些聚类算法作了对比。每一种算法各有优劣,天文学家应根据天文数据的特点,探讨出适合天文数据特点的离群数据探测方法,以发现一些不同寻常的、稀有的、甚至新类型的天体和天文现象。