摘要
准确表征兴趣点(POI)类别(如大学、餐厅等)是理解城市空间、辅助城市计算的关键。现有的POI类别表征模型通常只挖掘用户在POI之间的移动行为并学习序列特征,而忽视了POI数据的空间特征和文本语义特征。为了解决上述问题,提出一种融合空间和文本信息的POI类别表征学习模型Cat2Vec。首先,利用POI的空间共现关系构建POI类别共现点互信息(PMI)矩阵;然后,基于预训练的文本表征模型学习POI的文本语义特征;最后,引入新的映射矩阵,并基于矩阵分解技术将PMI矩阵分解为POI类别表征矩阵、文本语义特征矩阵以及映射矩阵的内积。在两个真实世界的数据集Yelp和高德上进行的POI语义重叠度评测中,相较于基准模型中表现最好的Doc2Vec模型,所提模型的性能分别平均提高了5.53%和8.17%。实验结果表明所提模型能更有效地嵌入POI语义。
- 单位