摘要

目的用模拟研究的方法,对含周期性的时间序列数据中的连续型缺失数据进行填补,比较基于周期信息的时间序列缺失值填补法(简称周期性填补法)和spline插值填补法对连续型缺失数据的填补效果。方法分别应用模拟时间序列数据和实际时间序列数据模拟连续型缺失,比较两种方法在不同连续缺失个数下的缺失值填补效果。采用NRMSE和RMSE量化填补的误差。结果除连续型缺失长度为10和平,随着连续缺失个数的增加,周期性填补法的填补误均小于spline插值填补法。周期性填补方法的填补误差在5~30的连续缺失范围内无明显波动,始终保持在一个较低的水平;而spline填补值的误差随着缺失个数的增加明显增高。结论对于含有确切周期性的时间序列,周期性填补方法对连续型缺失数据的填补效果相对于spline填补更好,填补误差稳定,并且不随连续缺失长度的增加而有较大的变化。

  • 单位
    中山大学公共卫生学院

全文