摘要
股票组合中成分股的构成与权重反映了基金经理的投资策略与投资风格,在实践中,这些信息往往存在披露频率低、披露时间滞后以及有限披露的问题。通过研究提出了一种基于二次规划的层次聚类降维模型,能够仅根据样本空间股票与投资组合的历史收益率,快速估算出股票组合当前成分股的构成与权重。同时选择上证50指数验证模型的效果,发现样本区间内,层次聚类降维模型能够从A股全部样本空间几千只股票中,平均估算出上证50指数50只实际成分股中的29.3只股票,对高权重成分股预测精度约为73%,优于二次规划模型。另外,市场结构分化越显著,层次聚类降维模型相对二次规划模型的改进效果越明显。模型的有效性验证了A股市场分层聚类的结构特征。