摘要

移动通信和传感设备等位置感知技术的发展,将人和事物的地理位置数据化。由此形成的轨迹数据正以极快的速度产生并呈指数级增长。轨迹数据中蕴含着丰富的信息,对其分析和挖掘具有重要的社会和应用价值。轨迹相似性度量研究是轨迹数据管理和分析的基础,在轨迹计算中起决定性作用。轨迹相似性度量通常以时间、空间或若干关键词作为参数,度量轨迹之间的相似程度。本文总结归纳了现有的轨迹相似性度量经典研究工作。首先,总结归纳了轨迹大数据的高维异构、多粒度、不确定、高冗余的特点,对轨迹的相似性度量问题进行了形式化的描述。其次,依据不同的数据类型,就经典的空间相似性、文本相似性和时间相似性的评价方法分别进行了说明和总结;依据轨迹形式与度量范围,将现有工作分为了基于离散点的轨迹全局和局部相似性,基于线段的轨迹全局和局部相似性的计算方法,并评价了各种方法的优缺点。再次,分析了轨迹相似性度量在交通管理、城市规划、智能推荐、智慧出行等领域的具体应用。最后,总结展望了轨迹相似性度量在未来研究与应用方面的发展方向。