摘要
因果分析是数据挖掘领域重要的研究课题之一.由于传统的Granger因果模型难以准确识别多变量系统的非线性因果关系,本文提出一种基于Hilbert-Schmidt独立性准则(Hilbert-Schmidt independence criterion, HSIC)的组Lasso模型的Granger因果分析方法.首先,利用HSIC将输入样本和输出样本映射到再生核Hilbert空间,克服了传统的Granger因果模型不能应用于非线性系统的缺陷.然后,建立具有组Lasso约束的回归模型,对多变量及其组派生变量进行因果分析,并采用贝叶斯信息准则进行模型选择,避免了人为设置滞后阶数和正则化参数.最后,根据HSIC-GL模型的回归系数和显著性检验结果,实现了多变量时间序列之间的非线性因果分析.通过对非线性和混沌系统的仿真实验,验证了该方法的有效性.最后将其应用于沈阳空气质量指数(AQI)和气象时间序列的因果关系分析.
- 单位