一种偏差和方差双降的双鲁棒去偏学习模型

苗忠琦; 童向荣<sup>*</sup>

摘要

在推荐系统中，点击后转化率是反映用户偏好的重要信号．然而，传统的双鲁棒估计器在预测转化率时存在选择偏差的问题，这会导致估计器方差和偏差过高．为解决以上难题，提出了通用的双鲁棒去偏学习模型，在选择偏差场景下提出更具稳定性的双鲁棒估计器，该估计器通过改进填充模型的训练权重来增加低倾向样本惩罚，缩小点击样本和曝光样本的分布差距，缓解双鲁棒估计器的偏差影响；受强化学习双重深度Q 网络的启发，改进双学习模式为交替学习模型，交换转化率预测模型、点击率预测模型、填充预测模型之间的梯度信号，并指导网络模型的参数更新，缓解模型方差过高的问题；另外，在参数更新过程中，将预测模型的回归问题转化为二分类问题，降低了预测模型学习的复杂程度，提高模型可解释性．实验在两个真实的大型数据集和一个半合成数据集中进行，与已有的去偏方法对比，实验验证，所提方法在召回率和累计收益率方面优于其他方法，其中，相较于主要实现降低方差的更具鲁棒性的双鲁棒双学习模型在指标DCG@2和Recall@2上分别提升4.43%和4.97%，相较于主要实现降低偏差的双鲁棒联合学习模型在指标DCG@2和Recall@2上分别提升了7.21%和10.11%．

单位
烟台大学

收藏分享被引浏览

更新时间：2024-01-09 19:07

一种偏差和方差双降的双鲁棒去偏学习模型

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友