摘要
本发明涉及一种基于多智能体增强学习的事件语料库提纯方法,包括模型训练开始前需要对环境及智能体进行初始化重置,并设置相应的训练参数;智能体通过在环境中执行相应提纯优化动作,形成一系列训练所需的数据,对数据进行采样并存储至数据缓存区,以备后续训练使用;当数据缓存区中数据数量达到设定值,开始使用这些数据对所有智能体的现实网络进行训练和更新;当现实网络更新完毕后,通过不定时参数复制的方法更新所有智能体的目标网络;重复以上步骤,直到训练次数达到预设训练次数为止。本发明基于对于已标注数据进行提纯优化,从而解决了序列标注联合抽取模型在训练过程中遇到的数据标签噪声问题,从而提升了事件实体关系联合抽取任务的效果。
- 单位