摘要

针对互联网广告数据具有高维稀疏性的特点,在现有的点击率(Click-Through Rate, CTR)预测问题的相关理论和技术基础上,给出了一种基于梯度提升决策树(Gradient Boosting Decision Tree, GBDT)的卷积神经网络(Convolutional Neural Networks, CNN)在线广告特征提取模型(CNN Based on GBDT,CNN+). CNN+模型不仅能从原始数据中提取出深度高阶特征,还能解决卷积神经网络在稀疏、高维特征中提取特征困难的问题.在真实数据集上的实验结果表明,与主成分分析(Principal Component Analysis,PCA)和梯度提升决策树这两种特征提取方法相比, CNN+模型提取的特征更加有效.