摘要
变量筛选是处理超高维数据的一种有效方法。针对部分变量与响应变量显著相关,Barut等基于线性模型假定提出CSIS方法,能有效降低伪变量错选概率。但CSIS方法线性模型假定严苛,实际研究中有时不能事先确定模型结构。由此,本文基于非参数可加模型提出条件非参数独立筛选方法(CNIS),不需要对模型结构进行假定,增大了适用范围。同时,在适当条件下,证明本文方法第1阶段的筛选具有一致性筛选性质,能以概率1保留重要变量;第2阶段的变量选择也具有良好相合性。Monte Carlo数据模拟结果表明:相较于NIS方法,本文方法表现更好。
- 单位