摘要

针对数据缺失问题,本文在完全随机缺失的前提下,对完整数据集进行不同比例的挖空处理,并使用K近邻算法进行缺失值填补;采用交叉验证法优化K值;最后借用高斯函数,对传统K近邻算法进行加权处理,提出加权K近邻算法。实验结果表明,不论K取值多大,加权K近邻算法填补效果均优于传统K近邻算法;且K=2时,两种算法填补效果达到最佳。

  • 单位
    贵州民族大学