摘要
主要研究了含有内生性协变量的超高维部分线性模型的重要特征筛选和变量选择问题。首先,为了消除数据内生性对特征筛选带来的选择性偏差,结合内生性协变量与工具变量的相关结构,给出了一个区分重要协变量和不重要协变量的充分条件,进而提出一种衡量变量边际效用的特征筛选方法。其次,利用提出的特征筛选方法,并结合剖面估计思想和两阶段正则估计方法,提出了一种识别重要协变量的变量选择方法。最后,在一定正则条件下,理论证明了所提出的变量选择方法可以消除数据内生性对变量选择带来的影响,从而保证了对协变量重要性具有排序一致性。
- 单位