摘要

缺失数据的问题在各领域中是不可避免的,而传统的数据挖掘算法在处理不完整的数据集时表现不佳。本文将协方差矩阵及协方差矩阵的行列式应用于粒子群优化算法的适应度函数中,并以迭代的方式得出最佳阈值,再使用最佳阈值进行基于进化聚类算法的缺失值重建,解决了阈值的选取困难及其对数据重建结果的影响问题。然后,在自联想极限学习机中调用具有最佳阈值的进化聚类算法,解决了自联想极限学习机输入权值选择的随机性。最后,选取6个UCI标准数据集及9个激活函数来进行验证。实验结果表明,相对于现有的大多数数据重建方法,所提的混合式重建方法可以更有效地完成缺失数据的重建。