摘要

针对现有基于生成文本和社交关系的联合位置推断方法对社交媒体中异质数据间的位置关联性挖掘不充分的问题,提出了一种基于多种提及关系的社交媒体用户位置推断方法。首先,综合考虑社交媒体文本中用户之间的提及关系、用户对位置指示词的提及关系和用户对地理名词的提及关系,构建包含用户、位置指示词和地理名词3种节点的异质网络;其次,基于共同提及关系提出用户-词语-位置简化算法来构建用户-位置异质网络,将位置邻近的用户更为紧密地联系起来;再次,提出有偏的随机游走算法对图中节点采样以充分探索网络结构,缓解已知位置的稀疏性问题;最后,采用基于多层感知机的神经网络分类器对用户进行位置推断。在GEOTEXT、TW-US和TW-WORLD这3个代表性Twitter数据集上的实验结果表明,所提方法可显著提高用户位置推断准确率。