一种在MapReduce下实现的KNN改进算法

作者:潘俊辉; 王辉; 张强; 王浩畅
来源:重庆科技学院学报(自然科学版), 2021, 23(1): 70-72,95.
DOI:10.3969/j.issn.1673-1980.2021.01.016

摘要

在文本分类过程中,经典的最近邻分类算法(KNN)面对海量数据时的执行时间较长.对经典KNN算法进行改进,通过在训练阶段构造初级分类器以减少训练阶段的计算量,并在Hadoop平台MapReduce下予以实现.实验结果表明,改进后的算法可以在保证分类精度的情况下节省运行时间.

全文