摘要

内河水路运输由于其特殊的通航环境,导致内河船舶的自动识别系统数据中存在着大量异常数据。针对传统异常数据处理常用的数据剔除和数据恢复方法中对原始数据造成的资源浪费问题,本文利用可视分析方法实现资源重复利用,帮助分析人员对长江内河的"脏"数据存在的异常模式和导致其异常的内河环境因素进行探索。结合散点图来反映轨迹点间的时空距离的查分从而挑选船舶自动识别系统中存在数据丢失和偏移现象的"脏"数据,对所有被标记为脏数据的船舶自动识别系统轨迹点展示在OpenStreetMap地图,利用内河中的实际案例对可视分析方法进行实证测试。通过自动识别系统数据的基站覆盖范围分析,船舶自动识别系统的数据偏移致因分析等结果展示可视分析方法在船舶自动识别系统异常数据挖掘中具有适用意义价值。