摘要

在指数跟踪问题中,股票指数与行业板块的相关性往往是集中在某些特定的行业,且行业走向通常由几个有影响力的公司决定,因此如何选取具有代表性的行业和公司是提高跟踪精度的一个很好的切入点.在以往的研究方法中,Lasso等变量选择方法忽略了行业因素的影响,而分层抽样则忽略了不同行业和股票指数关联性大小的不同.文章引入Sparse-Group Lasso方法,实现了对行业及行业内部单一股票的筛选,同时对跟踪误差的定义进行扩展,综合考虑线性和非线性两种跟踪误差的优点对股票组合的权重进行优化.实证表明,基于Sparse-Group Lasso方法筛选的股票组合的稳健性一致优于依据市值筛选的股票组合,当股票组合规模较小时,基于Sparse-Group Lasso方法筛选的股票组合的跟踪误差也要优于依据市值进行筛选股票的方法.