投诉文本的分类方法、系统和存储介质

作者:余本功; 曹雨蒙; 杨颖; 陈杨楠; 张强; 杨善林; 朱梦迪; 王胡燕; 汲浩敏
来源:2019-06-14, 中国, CN201910513241.9.

摘要

本发明提供一种投诉文本的分类方法、系统和存储介质,涉及文本分类领域。包括以下步骤:获取投诉文本,对投诉文本预处理;基于预训练的Doc2vec模型对投诉文本进行处理,获取文本特征向量;基于预训练的隐含狄利克雷分布模型对投诉文本进行处理,获取主题特征向量;基于文本特征向量和主题特征向量获取文本向量;基于预训练的支持向量机模型对文本向量处理,得到第一分类结果;基于预训练的随机森林模型对文本向量处理,得到第二分类结果;基于bagging方法对第一分类结果和第二分类结果进行处理,得到投诉文本的分类结果。本发明可以将投诉文本准确分类。