摘要
本发明公开了一种基于自编码器的任务导向型词嵌入向量融合方法,包括步骤:获取待融合的原始词嵌入向量;选定下游任务并计算出任务导向标签;对一个自编码器进行训练;获取融合后的元词嵌入向量;将元词嵌入向量经过解码器预测原始词嵌入向量和经过一个解码器预测任务导向标签,计算误差并进行反向传播训练;当遇到新词或者需要再训练时,通过训练好的编码器和融合操作即可得到新词的元词嵌入向量。本发明具有良好的特征筛选以及下游任务导向学习的能力,在重构原始词嵌入向量的基础上,提高了元词嵌入向量在下游任务的性能,可广泛应用于自然语言处理任务中的文本分类,命名实体识别等领域。
- 单位