摘要

本发明公开了一种基于词缀感知的社交媒体命名实体识别方法,包括步骤:采集已标注出命名实体的社交媒体数据集;捕捉词的嵌入表示、字符级别表示和词缀特征表示,并将词嵌入表示、字符级别表示和词缀特征表示进行融合,作为词的最终表示;将得到的词的最终表示输入到双向卷积神经网络以及条件随机场中,预测标签序列并计算损失值;根据得到的损失值,采用随机梯度下降算法对模型进行训练;将文本输入训练好的模型中,识别出文本中的命名实体。本发明丰富了词的语义表示、缓解了社交媒体数据中未登录词的问题,提高了命名实体识别的效果。