摘要

本发明公开了一种英文文本的命名实体识别方法,包括步骤:收集英文文本的命名实体识别的数据集;对收集的数据集进行预处理,标注数据集中每个词语的词性;对于输入到模型的语句,获得语句中的词语信息,包括词语的词向量、字符序列信息、词性序列信息;将获得的三种词语信息拼接起来,输入到LSTM网络中,获得LSTM网络的输出的特征;将得到的LSTM网络的输出特征输入到CRF中,获得最终预测的实体。本发明考虑了输入文本中词语的词性信息,通过在模型中加入词性信息,可以提升模型的性能。