摘要
本发明公开了一种基于多任务对抗学习的文本分类方法,包括以下步骤:预训练词嵌入向量;构建多任务特征提取器,提炼出多领域文本数据的共享特征和私有特征;引入多领域的对抗网络,使得共享特征空间包含更多共享特征和更少的私有特征;引入特征矩阵的正交约束,消除同时存在于共享特征空间和私有特征空间中的冗余特征;设计联合损失函数,构建完整的多任务对抗学习分类器;将共享网络层剥离出来,用于新目标领域文本数据的分类预测。本发明可直接应用于实际多领域文本数据的分类任务中,采用本发明中的多任务学习分类方法可以解决单任务学习会忽略任务之间所富含的关联信息的问题,且通过对抗网络和正交约束可提高文本分类的准确率。
- 单位