摘要

协变量平衡聚焦于消除处理变量和协变量的相关性,有助于在因果推断中减少极端权重的产生,提高估计量的稳定性和精度。目前二元处理变量下的协变量平衡相关研究较多,但连续处理变量下的协变量平衡研究有待进一步发展和完善。同时,现有研究直接基于平衡权重的角度实现协变量平衡,相应最优化为带等式和不等式约束的非线性规划,最优化求解相对复杂,导致方法对于大样本量数据尤其是微观数据的使用存在局限性。为避免上述不足,本文基于广义倾向得分的角度提出一种连续处理变量下的协变量平衡方法。该方法使得协变量逼近基的加权样本均值等于协变量逼近基的样本均值,平均剂量响应函数的估计量满足渐近无偏性和相合性。特别地,本文方法的最优化函数为严格凸函数且不带任何约束,从而最优化函数存在唯一解且求解相对简单,因此方法适用于大样本量数据尤其是微观数据的问题研究。此外,本文还提出一种特别的J折交叉验证方法,选择逼近基的阶数以实现数据驱动。数值模拟表明,本文提出方法的估计精度较高。将方法应用于中国家庭追踪调查微观数据,本文得出我国存在“年龄–储蓄率之谜”现象,即户主年龄与家庭储蓄率存在正U型关系,拐点约为42岁。

全文