摘要

以广州车牌竞拍价格数据集为数据来源,采用线性回归并结合k折交叉验证,研究小样本数据集的预测方法。为解决小样本局部特异性数据导致的验证误差增大的问题,提出验证之前先对数据进行全局混洗的策略。最后通过实验验证了此策略可以明显降低验证误差,以此为基础,通过多组实验验证,确定了合适的参数,结果表明最终预测值的总平均正确率达到了95%。