摘要

目前已经提出大量的处理平衡多分类问题的方法,但对于非平衡多分类问题还缺乏研究.针对这一问题,本文提出一种基于树形结构的非平衡数据多分类方法(Multiple classification method for imbalanced data based on tree structure,TMC-I).该方法首先统计多类样本各类别的数目,然后依次提取未分类样本中较多的一类作为正类,剩余类别样本合并作为负类并构造分类器,如此循环迭代分类构建一棵非平衡的二叉多分类树,从而将非平衡的多分类问题转化为一系列平衡的二分类问题.实验结果表明,TMC-I方法能够有效处理非平衡的多分类问题.

  • 单位
    晋中学院