摘要

在95598客户投诉意见工单的处理过程中,常出现结构化信息提取消耗时间长、信息提取侧重点有偏差、无法精准定位客户诉求热点等问题。目前投诉意见工单的信息皆为人工逐条进行信息提取,解决好结构化信息提取自动化,才能大幅度提升效率,实现资源有效分配。本文主要用正则表达式和命名实体识别模型相结合的方式,针对投诉意见工单信息的提取、客户诉求热点的定位给出一套完整的解决方案。针对用户编号、电能表编号、电话号码等有具体规则的信息采用正则表达式进行提取,而针对用户投诉原因关键点、台区名称等等无法用统一规则来界定的文本信息则采用命名实体识别模型来进行信息提取,实现信息提取流程自动化。并且在结构化信息基础上,利用数理统计方法对客户诉求热点进行定位。该模型对信息结构化提取的准确率在85%-95%左右。

  • 单位
    国网重庆市电力公司