摘要
产品质量检测(pruduct quality inspection, PQI)是维护市场秩序和保障健康安全的一项重要工作,通过自然语言处理技术对质检文本数据实体识别,能够有效监督和控制产品质量。为了提高PQI文本数据命名实体识别效果,提出一种融合注意力机制的CNN-BiGRU-CRF模型,在CNN层将字词向量和词长特征向量联合输入,充分获取文本特征。使用注意力机制重点关注目标信息特征,抑制无用信息,将输出序列进行加权后得到标注分数值,以提高识别精度。以人工构建的PQI数据集作为实验数据,并与其他模型对比。实验结果表明,该模型在8种实体类型的实体识别中准确率和F1值达到74.7%以上,优于其他传统模型,在PQI数据的实体识别上达到了较好的识别效果。
-
单位喀什大学; 上海第二工业大学