摘要

基于数据的机器学习是研究从观测数据出发寻找规律,并利用这些规律对未来数据进行预测。该文提出一种新的分类判别方法——覆盖算法,其主要过程是利用某种覆盖规则算法寻找一些训练样本集的支撑点(代表点),在决策的时候仅需计算待分类样本与支撑覆盖点之间的距离并进行比较,与之最近的支撑点所在类别即为代分类样本的类别。而支撑点仅占全部训练样本的一部分,所以相比最近邻方法具有较小运算量和存储量的优点。另一方面,覆盖算法主要是样本之间的距离运算,不需要像SVM那样考虑核函数的选择问题,因此更适用于大数据量的自动分类问题。对正常星系和恒星两类光谱数据进行实验,结果表明,覆盖算法具有较好的鲁棒性、较高的分类正确率。