摘要

电信客户投诉记录中包含大量非结构化文本信息和客户通信行为信息。为了进行客户投诉的自动分析和精准分类,针对这些具有高维混合特征的数据,提出一种基于Filter模型和随机森林的客户投诉分类方法。采用Filter模型进行特征选择,以信息增益比来衡量特征的重要性,从而删除无关冗余的特征,降低维数;构建基于随机森林的客户投诉分类模型。采用某电信运营商3个月的投诉数据进行实验,结果表明:该方法相比其他集成学习方法,能够显著提高投诉处理的准确性,从而验证了其有效性。