摘要
针对Clara算法在电力工程大数据分析领域的应用问题,文中介绍了Clara算法的基本思路与算法步骤,进一步提出了基于Clara算法的电力工程造价评估方法。其采用Clara算法通过反复随机抽样方法,利用部分数据样本还原整体数据样本的特征,实现对大规模电力工程数据进行聚类分组,并将聚类结果作为多元回归分析(Multiple Regression Analysis,MRA)的输入数据,分析得到电力工程数据对其造价评估的影响模式。通过算例测算结果表明,相比于PAM聚类算法与K-means,所提Clara算法能够减小聚类分析的计算时间,同时提高电力工程造价评估的准确性。