摘要
观测数据因果关系挖掘是很多学科的基础问题。然而基于约束与因果函数等的现有方法对数据的因果机制具有较强的假设,一般适用于低维数据,并不能很好地适用于存在隐变量的场景。为此,提出了一种基于信息瓶颈的因果关系挖掘方法,称为因果信息瓶颈方法。该方法将因果机制划分为压缩与提取两阶段,在压缩阶段,假设存在一个经过压缩的中间隐变量,在提取阶段,可能保留与结果变量相关的信息。在上述建模的基础上,通过推导其变分上界,设计了一种的基于变分自编码机的因果关系挖掘方法。实验结果表明,基于信息瓶颈的方法在合成数据中准确率提升了10%,在真实数据中准确率提升了4%。
- 单位