摘要

恒星光谱分类是天文数据处理的重要环节,由于天文望远镜的改进与发展,人类已获取海量的光谱数据,在如此大的数据量下,光谱的快速分类识别显得尤为重要。聚类技术是实现目标分类的常用方法之一,而聚类中心点的选择是影响聚类精度和效率的重要因素,基于此提出一种快速确定聚类中心的光谱聚类方法(Fast Determination of Clustering Center)(FDCC).首先预处理提取出给定发射线的置信度信息,将其作为聚类方法的数据,从而实现对光谱数据的降维;计算所有数据的密度和距离,将密度和距离组合成评判值,利用聚类中心的密度高且相互距离远的特点从评判值中找出奇异点;最后利用真正中心点的密度和距离不应相差过大的特点从奇异点中得到聚类中心,再根据聚类中心使用K近邻得到所有的簇。该研究使用LAMOST DR5的光谱数据进行了聚类测试,实验结果表明本文提出的快速确定聚类中心的光谱聚类方法(FDCC)能够有效地减少运行时间,并且较于其他的算法,具有更好的聚类结果。