摘要
针对碳排放报告中燃油消耗数据存在单个不连续缺失和连续缺失2类数据,使用单一方法估计误差大的问题,提出一种基于聚类分析的组合估计方法。该方法首先采用K-medoids聚类算法将数据归类为单个不连续缺失数据以及连续缺失数据,然后使用NB方法对单个不连续数据进行估计填充,使用DTW方法对连续缺失数据估计填充,最后分别在1%、2%以及3%均方根误差时进行估计结果评价。实验结果表明:基于聚类分析的NB-DTW组合方法能有效降低估计误差,在1%、2%以及3%均方根误差时比NB方法分别降低了9.3%、12.1%、12.96%,比DTW方法分别降低了35.46%、43.62%、55.04%。
- 单位