摘要
地址是一种不可或缺的空间数据资源,是建设智慧城市的重要地理信息载体。中文地址的解析和匹配在地址规范化和标准化等任务中具有重要意义。传统的方法是将中文地名的匹配转化基于规则和字符串形式,可以实现规范地址的匹配,但对非标准地址或者复杂地址难以有效解析和提取。本文采用深度学习网络算法进行中文地址匹配,提出了一种基于字词特征融合的中文地址匹配方法。首先依据地址文本的特殊结构,构建一种基于字、词以及地址特征融合的深度学习网络架构模型,将字、词标记及其特征转换为向量表示,然后通过字词特征融合获取地址的语义信息,最后通过相似度算法实现地址信息的匹配。在自主构建的数据集上,本文提出的方法 MFAM(Multi-Feature-AddressMatching)在准确度上相比其他方法提升了5至7个百分点,证明MFAM模型在地址匹配任务上有着更好的表现。