摘要

目的本文旨在通过填补时间序列资料中的随机型缺失数据并拟合ARIMA模型,比较三种填补方法的填补和预测效果。方法利用SAS产生平稳、有周期性的时间序列并构造不同比例的随机型缺失,分别采用周期性填补法、均值填补法和三次样条函数插值法进行缺失数据的填补,并对填补后序列拟合ARIMA模型进行序列预测。采用配对t检验对三种填补方法的填补误差和序列预测误差进行比较。结果三种填补方法的填补值与真值的差异均无统计学意义(P>0.05);随着缺失比例的增大,周期性填补法的填补误差和序列预测误差均小于三次样条函数插值法和均值填补法。结论周期性填补法对于含有确切周期信息的时间序列缺失数据,填补效果较优。

  • 单位
    中山大学公共卫生学院