文本分类一直是自然语言处理的重要应用基础研究方向,多标签文本分类表示一个样本可能对应一个或多个标签。现有的多标签文本分类算法更多偏重的是文本语义化的表示,并未考虑到多个标签之间存在的关联关系。根据文本先验数据,提出一种新的改进模型,找到有关联的标签,相关联的标签形成一个簇,同时用新的标签来表示这个簇。该模型即考虑文本语义化的表示,又降低模型的输出空间。仿真实验结果证明,该模型在精确度有所提高以及降低汉明损失。