基于RAKEL算法的商品评论多标签分类研究与实现

作者:梁睿博; 王思远; 李壮; 刘亚松
来源:软件工程, 2019, 22(01): 8-11.
DOI:10.19644/j.cnki.issn2096-1472.2019.01.002

摘要

商品通常包含多个属性维度,准确找到商品评论中涉及的属性维度是文本挖掘工作的基础。RAKEL算法是多标签分类中问题转换思路的一种实现。在以往的工作中,由于子标签集合的随机性,没有充分发现和考虑标签之间的相关性,导致分类精度不高。为此,提出了改进的FI-RAKEL算法。首先通过FP-Growth算法得到标签的频繁项集,再从频繁项集和原始标签集合中选择标签构成新的标签子集,以此充分利用标签相关性训练基分类器。实验证明,改进的FI-RAKEL算法具有更好的评论文本多标签分类性能。