摘要
本发明提供一种基于双端对比学习的文本摘要生成方法和系统,涉及文本摘要生成技术领域。本发明从整体(编码器端和解码器端)提高基于Seq2Seq的文本摘要模型生成高质量摘要的能力;包括:在编码器端,根据所述训练集中的输入文本,获取第一正负样例对,并构建第一损失函数,即利用对比学习增强编码器的编码能力;在解码器端,根据所述训练集中的输入文本和参考摘要,获取第二正负样例对,并构建第二损失函数,即利用对比学习缓解模型的曝光偏差;根据第一、二损失函数,并在所述解码器端引入交叉熵损失函数,构建总损失函数;根据所述总损失函数,对模型进行联合训练直至收敛,并且以单阶段完成,增加模型训练和推理效率。
- 单位