摘要

基于特征交互建模方法的点击率预测问题经广泛探索已经取得较大进展,它能缓解有效信息损失,但在一定程度上依赖于不同特征的共同出现,存在特征稀疏问题.因此,针对交互过程特征出现次数少不能高效学习特征表示的问题,提出了一个基于轻量图卷积增强嵌入层学习的点击率预测模型LGCDFM(LightGCN with DeepFM).在初始嵌入层采用分而治之的学习策略,提出图结构中区分不同类型节点,首先由同类型节点信息传播确保特征出现频率,再由高阶连通的不同类型节点间交互捕捉多跳邻居信息.轻量图卷积神经结构强大的特征提取和表示学习能力,且摒弃无益于交互的特征变换和非线性激活函数,成为处理简单用户-项目交互数据的协同过滤任务的优势,有效减轻特征稀疏性问题.最后,表示学习层应用点击率预测经典模型DeepFM端到端学习高阶和低阶特征组合,由隐向量从稀疏数据中学习,提升点击率预测任务性能.通过在Criteo、Avazu两个公开数据集上的实验表明,该模型在点击率预测和特征稀疏问题上的性能表现均优于现有方法.

全文