摘要

本发明公开了一种无监督句子表示方法、装置、计算机设备及存储介质,属于自然语言处理领域。针对现有技术中存在的负样本句子随机采样容易导致现有的对比学习模型性能造成缺陷从而无法生成高质量句子表示的问题,本发明将锚点句子表示与负样本句子表示的语义相似度分数输入到负样本排序损失函数中计算得到经排序后的负样本句子表示,将语义相似度分数的分布概率输入到标签平滑损失函数中计算得到经标签平滑的负样本句子表示,将锚点句子表示进行数据扩增得到正样本句子表示,输入正样本句子表示、经排序后的负样本句子表示、经标签平滑的负样本句子表示到对比学习损失函数中进行训练构建对比学习模型,进而通过对比学习模型生成高质量句子表示。