摘要
目前,95598重大服务事件报送为全人工方式,效率低下且存在主观偏差,一次提报精确率为30%左右。文章以95598语音转写文本数据为研究对象,构建文本分类模型。首先针对语音转写文本语言特点,引入电力专业词库及停止词典,并对转写有误词语及同义词进行归一化表示;其次针对传统文本表示缺点,引入分布式表示方法;然后针对数据分布不平衡特性,引入改进的损失函数;最终对多种基于深度学习及传统机器学习算法的模型进行全面比较。结果表明,基于GRU算法及MSFE损失函数的TextRNN模型精确率达72%,远高于人工方式,可有效支撑国家电网公司客服中心风险管控工作。
-
单位国家电网公司客户服务中心