摘要

大规模数据中实体异质性和数据不完整性等因素严重制约了因果推理的品质.本文提出了不完整数据双重鲁棒因果推理模型,实现了基于随机分配机制与无偏响应参数估计的因果效应辨识.首先拓清了基于观察数据的因果效应可辨识和可估计的条件.引入处理分配概率分布的概念,构建基于最小化绝对标准偏差的整数优化模型,消除了处理组与对照组之间的协变量不均衡性.通过数据匹配选择模型推导基于最优解或近似优化解的数据子集,实现两组案例之间处理分配的再随机化.通过增强逆概率加权方法,实现案例不完整响应参数的无偏估计.该方法对响应参数估计与处理分配概率的不确定性兼具有鲁棒性,提高了因果效应辨识的品质.最后通过真实案例和拓展数值分析,验证了本方法的有效性.