摘要
针对现有基于约束的因果结构学习方法很少考虑高维小样本场景下因果结构学习的效率低,且存在马尔可夫等价类的问题,本文以非线性非高斯的高维小样本为研究对象,提出一种基于递归分解的因果结构学习算法(Causal Decomposition Reconstruction, CADR)。该方法在高维小样本的因果结构学习效率方面,采用递归分解的思想,把高维变量集递归分解为多个更小的子集,直到无法再分解或子集的大小达到阈值为止。在这一过程中,由于变量集的减少缩减了条件独立检验的条件候选集的搜索空间,进而提高学习效率。同时,为了识别马尔可夫等价类,CADR算法利用了非线性非高斯模型的因果方向的不可逆性,通过判断拟合噪声项与原因变量是否独立,可以有效地识别马尔可夫等价类的因果方向。仿真数据和真实因果结构数据的实验表明,CADR不仅能提高条件独立检验的效率,在真实因果结构实验中与现有基于分解的方法相比,F1评分提高了5%-12%,而且能有效地区分马尔可夫等价类,学习到更精确的因果结构。
- 单位