摘要

针对交通出行服务中推荐方式单一、容易忽略用户出行偏好等问题,借鉴多粒度级联森林结构,提出了一种级联梯度提升树模型(CaGBDT).该模型利用级联结构增加模型的深度,进而实现了特征的深层次表示学习.同时,为了解决样本类别不平衡问题,提出了一种基于鲍威尔算法的指标优化层,其通过为每个类别搜索一个阈值,对模型的预测结果进行权重修正,以实现最大化评价指标的目的.此外,CaGBDT模型可以根据用户的出行记录,构建用户出行全局关系图,利用图嵌入表示学习方法,自动提取用户出行的空间上下文关系,从而提高特征提取的效率。

全文