摘要
本发明公开了一种基于深度集成学习的投诉短文本分类方法,包括:对客户投诉文本集进行预处理,得到预处理投诉文本集;根据预设的投诉文本的主题分类设计投诉分类标签,并将预处理投诉文本集打上相应的投诉分类标签,得到训练样本集;采用BTM主题模型对训练样本集进行文本特征提取,得到文本特征向量;采用卷积神经网络对训练样本集进行文本特征提取,得到卷积语义特征向量;采用归一化组合策略对文本特征向量和卷积语义特征向量进行归一化并融合,得到组合文本特征向量;将组合文本特征向量输入随机森林模型进行训练,根据不同决策树的差异性,采用加权法将多个决策树的分类结果进行组合,获取概率最大的类别作为训练样本集的文本分类结果。
- 单位