应用SARIMA模型预测主题词研究热度

作者:陈煜杰; 王一蒙; 任飞亮
来源:小型微型计算机系统, 2022, 43(10): 2022-2027.
DOI:10.20009/j.cnki.21-1106/TP.2021-0154

摘要

随着科学技术的飞快发展,如何通过已有某主题词历史的研究情况预测未来该某主题词以此来判断某领域是否具有研究意义的问题已经变得越来越不可忽视.在本文中,利用主题词论文的发表数量来体现该主题词的研究热度.以往科技文献的预测模型没有统一的评判标准,导致结果的信服程度低;只是简单的考虑到某一时间范围均匀地减少,没有对具体到季节变化进行模拟,模型的准确度低;模型最优解参数难以确定,迭代周期长.本文以预测科技文献的发表数量为目的,运用时间序列预测的研究方法.通过分析前人的对于时间序列预测所题出的模型,根据科技文献的发表特点提出使用SARIMA模型进行预测.使用Python进行仿真实验,采用AIC作为评判模型的指标,采用图像初步判断模型参数范围与迭代进一步确定模型参数的办法,结果表明采用SARIMA模型得到的AIC指标为505.859相比于仅采用ARIMA模型得到AIC指标646.363表现良好.最后尝试将SARIMA模型拓展应用于其他领域,结果都表明SARIMA模型优于ARIMA模型.最后本文结论,在预测季节性数据的情况下,可以采用本文提出的实验过程,广泛应用在其他领域,表现出色同时具有实际意义.