摘要
以更全面概括用户兴趣特征为目的,设计基于大数据驱动的用户画像自动生成模型。模型由信息预处理层、画像计算层、数据层等组成,其中信息预处理层采用LSTM-CRF用户画像信息抽取模型,依据信息字段定义启发原则,从用户网络主页获取用户性别、头像等基础信息。依据该基础信息使用多标签学习算法获取用户兴趣标签分类结果后,将该结果输入至数据层内;画像计算层调取数据层内用户标签分类结果并融合后,生成用户画像,将用户画像传输至存储层存储,利用Java编程技术调度存储层内用户画像信息传输至画像展示层,实现用户画像可视化展示。实验结果表明,上述模型抽取用户画像信息的正、负偏差数值仅为0.08左右;生成的图书馆用户画像不仅包含用户图书兴趣标签,也可以充分描述用户的图书类别偏好程度。
-
单位吉林建筑大学; 吉林建筑大学城建学院