摘要

KNN算法中各样本特征被视为等值权重,特征之间的关联因素没有考虑在分类算法中。为了解决此问题,提出一种基于皮尔森相似度和距离权重的改进KNN算法,根据训练样本和待分类样本计算皮尔森相似度和距离权重来判定特征和类别的相关度,且提出一种贡献率类别的判定方法。仿真结果表明,与KNN算法相比,提高了算法的分类精确度。