摘要

基于95598业务,利用大数据分析挖掘方法,构建统一身份识别模型,有效识别客户来电号码与户号的对应关系。采用大数据文本挖掘技术,有效解析用电地址信息、客户姓名等内容,并计算地址相似度得分、姓名相似度得分,作为对应关系校验以及识别疑似户号的关键因子指标。针对能获取到的对应关系,构建权重划分模型,计算对应关系匹配度得分,根据分值大小,校验对应关系的可靠性。针对找不到户号对应关系的来电号码,基于文本相似度得分构建KNN模型,计算对应关系匹配度得分,依据分值大小,识别疑似户号。

  • 单位
    国家电网有限公司