挖掘社交媒体文本的地理位置信息能发现其空间关系,提出了基于多模态融合的社交媒体文本地理位置预测方法,利用文本获取的相关图片作为增强数据,构建图文数据集,以提高地理位置预测的准确性。多模态融合模型分别利用图片通道和文本通道提取两者的地理位置信息。同时,引入图文匹配模块对图文对进行降噪,解决图文不匹配问题。在Geotext数据集上进行的地理位置预测实验结果显示,与基线模型相比,中值误差距离降低了18.8%,平均误差距离降低了4.5%。