摘要
本文结合条件生成式对抗网络(CGAN)和改进的Wasserstein生成式对抗网络(WGAN-GP),提出一种适合于命名实体识别任务的条件Wasserstein生成式对抗网络模型(CWGAN).该模型借鉴CGAN以文本描述为条件的图像概率分布的思想,来完成以句子序列为条件获得标注序列概率分布的任务.该模型的生成器和判别器都采用BiLSTM结构,不同的是生成器生成命名实体标签的概率分布,判别器则为生成器的生成质量打分并反馈给生成器,生成器根据反馈更新梯度从而提升生成标签概率的质量.另外,CWGAN采用梯度惩罚的方法来保证梯度在反向传播的过程中保持平稳,通过拉近真实样本分布和生成样本之间的Wasserstein距离,优化目标函数.最后通过实验验证了该方法的可行性和优越性.
- 单位