摘要

针对传统的基于手机信令数据的居住地人口分布分析方法的不足,通过建立一种基于手机信令数据和问卷调查数据的多源数据融合手段,利用有监督机器学习方法,实现对居住地人口分布现状的分析。首先通过问卷调查数据获取志愿者的实际居住地位置及其所使用的通信运营商相关信息,并进行样本筛选。其次,在通信运营商内部机房建立志愿者用户实际居住地位置与手机信令数据位置信息之间的对应关系。最后,利用手机信令数据,通过获取志愿者在居住地网格位置的停留特征以及非居住地网格位置的停留特征训练朴素贝叶斯分类器模型,继而完成机器学习方法的建立并应用到其他手机用户实际居住地的识别。分析结果表明:基于有监督学习方法的人口分布辨识方法较传统的阈值判断方法预测精度有明显提升。