基于特征和类别干预的少样本实体识别方法与模型

作者:刘永彬; 陶治华; 欧阳纯萍; 万亚平; 林强; 田纹龙; 聂沛
来源:2022-02-08, 中国, CN202210117810.X.

摘要

基于特征和类别干预的少样本实体识别方法与模型,涉及自然语言处理技术领域,该方法包括:构建输入特征干预模型和类别调整干预模型;将支持集和查询集交叉样本间的特征X提取出来,输入至特征干预模型中,对特征X进行注意力门前干预,获取特征层级调整;将调整后的特征输入至类别调整干预模型中,对分类器概率输出进行重定义,将来自预训练的特征均值依据分类概率重新分配新的权重,进行类别调整,得到新类特征,计算查询集中每个样本在所有类下的最小距离,并利用解码器得到查询集样本的分类预测值。本发明通过对特征和类进行干预,消减了混杂因素的干扰,增加了相似语义样本之间的差异,提高了实体分类器的辨别能力。