季节性差分自回归滑动平均模型对肺结核发病情况的预测效果研究

作者:任飞林*; 刘小琦; 金玫华; 孙秀秀
来源:中国防痨杂志, 2023, 45(05): 514-519.
DOI:10.19982/j.issn.1000-6621.20220517

摘要

目的:分析季节性差分自回归滑动平均(seasonal auto regressive integrated moving average, SARIMA)模型用于肺结核发病情况预测的准确性。方法:通过“中国疾病预防控制信息系统”子系统“传染病监测系统”收集浙江省湖州市2010年1月至2021年12月肺结核发病数据。利用2010年1月至2020年12月湖州市肺结核月报告数据,分别建立月报告发病数SARIMA模型与发病率SARIMA模型,以2021年1—12月肺结核报告发病数据验证模型,并用平均绝对百分比误差(mean absolute percentage error,MAPE)和均方根误差百分比(relative root mean square error percentage,RMSEP)评价两种模型的预测效果。结果:肺结核月报告发病数SARIMA(0,0,1)(0,1,1)12模型和月报告发病率SARIMA(0,0,1)(1,1,1)12模型为最佳拟合模型。经模型验证,2021年9月湖州市肺结核真实报告发病数(112例)与模型预测发病数相差28.571%,且高于95%CI上限值(109例),其他月报告发病数均在预测值95%CI范围内;2021年湖州市肺结核月报告发病率均在预测值95%CI范围内,其中真实值与预测值最大百分比误差为8.665%。按全年累计发病统计,月报告发病数模型与发病率模型的2021年预测值与真实值百分比误差分别为4.866%和2.483%。月报告发病数模型的MAPE为9.925%、RMSEP为14.167%,月报告发病率模型的MAPE为3.798%、RMSEP为4.463%。从评价效果看,月报告发病率SARIMA模型的MAPE和RMSEP均小于月报告发病数SARIMA模型。结论:基于2010—2020年湖州市肺结核月报告发病数与发病率建立的SARIMA模型有较好的拟合效果,且月报告发病率模型预测效果优于月报告发病数模型。