摘要

针对当前方法推断结果类型受限及准确率较低的问题,以移动用户位置数据为对象,综合利用时空共现区统计数据和语义信息,提出一种新的社会关系类型推断方法。通过用户共现频次、时空共现区位置熵和离散距离3种统计数据计算时空共现强度;依据时空共现区公共地点和用户个人地点识别结果获取其语义信息。结合时空共现强度和语义信息生成时空共现向量,根据向量特征的类别相关性和冗余信息量,按照"最小相关-最大冗余"原则提取时空共现区语义特征,得到特征向量。针对样本特点和社会关系类型推断需求,选择多分类支持向量机算法构造分类模型。在Foursquare数据集上进行实验验证,结果表明,该方法能有效推断移动用户的家人、同事、朋友和其他4种社会关系类型,准确率高达89.3%,与同类方法相比精确率和召回率分别提高7.9%和6.6%。

全文