摘要
逻辑回归作为一种经典的分类算法,该算法的结构简单且可解释性强。然而,逻辑回归难以处理模糊与不确定的非线性数据。为了解决这一问题,通过采用粒计算理论中的邻域粒化技术,提出了一种基于邻域粒化的逻辑回归算法。对于非线性数据,邻域粒化使数据更容易进行分离和构造。首先,在数据集样本的单特征进行邻域粒化,构造出邻域粒子。然后在多特征上形成邻域粒向量。此外,定义了这些邻域粒向量的度量与运算规则,并设计了一种邻域粒逻辑回归算法,有效地提高了逻辑回归的分类准确性。在WDBC,Iris以及Seeds等数据集上进行了分类实验,与经典的逻辑回归进行了比较,结果表明,本文提出算法的分类准确率相较于经典的逻辑回归在三个数据集上分别高出0.6%,7.6%,4.1%。
- 单位