摘要

为挖掘畅销轿车的潜在共性,并解决人为分析数据规律时存在效率低、分析不全面等问题,提出了收集数据、建立数据库、数据库挖掘的系统方法。收集了2016年全年销售排行前100轿车的多方面参数配置数据,建立了代表车型的参数配置数据库,并在R语言数据分析环境下进行数据挖掘。采用ggplot2扩展包,从级别、厂商指导价格、品牌3个方面对数据库做了基本分析;进一步结合Arules Viz扩展包,用Apriori算法对数据进行了关联分析,发现了畅销轿车参数配置的潜在共性以及轿车购买者的主流偏好。