在较高维度下的特征集合中如何筛选出重要子集是统计学中经常遇到的问题,而利用建立合适的稀疏模型使得模型复杂度降低的方法是近年来各领域学者研究的热点。文章基于在模型建立前考虑存在因高维自变量间的高度线性相关性而具有的组结构特性问题,提出了一种新的基于变量聚类的主成分Lasso(简记为VPLasso)降维算法。数值模拟结果表明,当模型中自变量同时具有组间稀疏和组内稀疏两种特性时,提出的降维算法不仅在回归参数的估计精确度上,而且在变量选择准确性上都优于经典的组结构特征选择算法。