摘要

目的为了研究社交媒体数据和流行性感冒(流感)暴发的关系,为有效预防流感提供参考信息。方法利用网络爬虫收集澳大利亚2015年第1周至2017年第29周的Twitter数据,获得社交媒体中的流感相关讨论数据,通过关键字过滤技术获取Twitter中包含sore throat、stuffy nose等有意义推文,采用ARIMA模型和Holt-Winters指数平滑模型对提取的推文列表建模,并进行对比。结果基于Twitter数据的ARIMA模型平均相对误差为6.40%,Holt-Winters指数平滑模型平均相对误差为17.06%。结论基于Twitter数据的ARIMA模型能够有效的预测澳大利亚流感病例的发展趋势。