摘要
针对公交车GPS数据量大、数据密度不均匀、噪声点多等问题,提出PB-DBSCAN (pixelbased-DBSCAN,PBDBSCAN)算法。将聚类过程中判断数据点之间的关系改为判断像素格之间的关系,减小数据点邻域中的搜索范围,加快聚类速度。因公交线路的多样性,同一聚类参数无法适应所有线路,提出一种动态参数选择的方法。在石家庄公交车GPS实际数据集上进行实验,其结果表明,PB-DBSCAN可以有效识别并过滤GPS数据集中的噪声点,实现快速聚类。与采用固定参数的算法进行比较,参数的动态选择提高了聚类准确度。
- 单位