摘要
针对在百万级用户计算与目标号码轨迹最相似的用户存在时间复杂度高,推荐精度低的情况,提出了一种轨迹相似度的快速计算框架。这一框架将时间地理位置组合形成字符串,能够对时空金字塔匹配等多种经典的轨迹分析模型进行效果增强和性能增强,并基于增强后的轨迹分析模型完成轨迹相似度判别。该框架能够针对手机信令数据的特点进行去噪,清洗其中的冗余数据、无效数据及乒乓切换数据,将手机信令应用于轨迹重合度比对的实践性框架,其优势在于灵活适配广泛的相似度度量模型,并兼顾了算法准确度和计算效率。本文对优化后的时空金字塔匹配模型(STPM)、最长公共子序列LCS算法、MinHash算法、SimHash算法及动态时间归整DTW算法5种不同的轨迹相似度算法进行量化对比,在效率和准确度两方面进行讨论。在本文的实验数据集上,优化后的时空金字塔匹配算法效果优于其他几种算法。
-
单位国家计算机网络应急技术处理协调中心