摘要
目的探讨支持向量机(SVM)在肾综合征出血热(HFRS)发病率预测上的优势及应用前景。方法首先,利用辽宁省葫芦岛市1984-2006的气象资料(包括平均气压、平均气温、平均降雨量、相对湿度、日照时数、日照百分率)和动物疫情资料(包括鼠密度和鼠带病毒率)共8个指标作为解释变量,所有变量均进行归一化到[0,1]区间,将整个数据集分成训练集和检验集,从数据集中随机抽取1/3个体(舍入取整)组成检验集,其余样本作为训练集。其次,利用软件R2.60构造HFRS发病率预测的SVM模型,获得误差平方和。最后,与基于反馈(BP)和径向基函数(RBF)神经网络模型的预测结果进行比较。结果对于训练集,SVM拟合的误差平方和的-x±s为(0.031±0.009),而BP和RBF神经网络拟合的误差平方和的x-±s分别为(0.074±0.030)和(0.082±0.018);对于检验集,SVM预测的误差平方和的x-±s为(0.067±0.021),而BP和RBF神经网络预测的误差平方和的x-±s分别为(0.073±0.022)和(0.089±0.036)。结论SVM作为近年来在统计学理论的基础上发展起来的一种新的模式识别方法,在解决小样本、非线性及高维模式识别问题中具有较高的预测精度和较强的泛化能力。该模型对于发病率的预测是可靠的,可以作为HFRS疫情预测的参考方法。
-
单位中国医科大学; 葫芦岛市疾病预防控制中心