摘要

由于受到客户方言及语言习惯因素影响,加之客户服务中心客服坐席手工记录客户地址的形式不统一,难以实现精确筛选细化到小区、村庄级别的相近地址,支撑定位客户反映的频繁停电等问题。该文提出了一种地址模糊匹配模型,根据地址信息的文本和拼音形式,利用最小编辑距离算法量化非结构化客户地址间的偏差程度。进一步应用支持向量机分类技术,结合地址文本信息和拼音信息的编辑距离计算结果,实现对相近地址的有效识别。试验结果表明,该方法可以克服谐音字对地址识别的影响,具有计算速度快且识别能力强的优势,能够支撑筛选频繁停电地址等场景应用。另外,通过网格搜索法的应用,实现了支持向量机分类器主要参数的优化,提升了模糊地址匹配的精度。

  • 单位
    国家电网有限公司