摘要
为了有效利用专业领域知识,对知识抽取展开研究,针对传统命名识别容易受上下文相对距离的影响、实体整体识别效果差的问题,提出了一种多头自注意力机制与条件随机场(CRF)结合的实体抽取模型。该模型基于Transformer架构,使用多头自注意力机制有效获取上下文信息,构建了多头自注意力机制与CRF结合的实体抽取改进模型,通过拼接多个自注意力机制,减少了对上下文中相对距离过多的约束并特征提取,实现了上下文全局信息的获取能力,提高了模型的泛化能力。最后,基于《人民日报》公开数据集,与其他机器学习模型进行了实验对比,验证了本方法的有效性,并在水下机器人任务作业数据的实体抽取中取得了较好的实验结果。
- 单位