混合神经网络的中文地名识别方法

作者:朱鹏; 石丽红*; 焦明连; 刘晓东; 孙浩
来源:测绘科学, 2021, 46(11): 159-165.
DOI:10.16251/j.cnki.1009-2307.2021.11.023

摘要

针对互联网媒体数据中地名信息表达不规范、实体边界不清晰、地名简化表达问题,该文提出了一种混合神经网络的中文地名识别方法。通过ALBERT层学习字级别特征表达与BiLSTM层提取文本上下文语义特征,由CRF层获得全局最优标记序列,更有效地识别并提取中文地名。数据测试表明:相较于BiLSTM的地名识别模型,本文模型精确率提高12.89%,F1值提高10.83%;相较于BiLSTM-CRF的地名识别模型,本文模型精确率提高3.56%,F1值提高2.1%;相较于ALBERT-CRF的地名识别模型,本文模型精确率提高1.22%,F1值提高0.72%。

  • 单位
    中国测绘科学研究院