摘要

[目的/意义]微信服务推文信息的命名实体识别是高校图书馆智慧服务领域的重要研究方向。在目前微信服务推文的命名实体识别领域中,存在高校图书馆微信服务领域的实体名称多样、特征信息提取不明确等问题。[方法/过程]针对以上问题,本文通过挖掘高校图书馆服务领域的微信服务推文文本,采用现有知识库和词典规则扩充句子语义信息,并在领域专家的指导下构建了一种高校图书馆微信服务推文文本的命名实体语料集ULICNER,实验数据集包含36 035条文本语料数据,7大类16个小类。采用基于BERT-BiLSTM-CRF的模型研究高校图书馆微信推文文本的命名实体识别方法。该模型利用BERT网络将大规模文本生成具有语义特征的字符向量,接着对输入文本序列通过BiLSTM获取文本特征,最后连接CRF获得最佳的序列标记输出。[结果/结论]实验结果表明,本文模型在构建的数据集上取得良好的效果,其F1值为98.75%,准确率值为98.59%,召回率值为98.91%,模型可以运用于高校图书馆信息服务的实体识别任务。

  • 单位
    数学学院; 福建工程学院