一种基于改进的K-Means算法的订单分批方法。本发明公开了一种基于数据挖掘的订单分批方法,包括如下步骤:1对数据集进行向量化处理,获得订单集X;2通过交叉检验法获得距离阈值T1和T2;3利用Canopy算法得到簇个数K及中心点;4利用上一步得到的K值以及中心点,使用改进的K-Means算法进行聚类;5得到最终的聚类结果之后,按照每个聚类的订单的平均到达时间进行排序,得到订单分批的结果。本发明能准确地对大批量的物流订单进行分批,从而提高分拣作业的效率,减少分拣环节所占用的时间。