摘要

A股高送转作为我国政策特有的现象,对其精确、有依据的预测有一定的研究价值.本文对A股数据集进行缺失值、异常值、标准化等数据处理,采取特征选择中过滤法、包裹法、嵌入法等方法提取特征,结合经济学意义得到最终特征.数据的不平衡采取过采样、欠采样以及SMOTE采样等方法处理.最后采用基于Stacking算法融合模型,第1层学习器采用5种分类机器学习模型,并进行超参数调整;第2层采用LightGBM模型预测,以F1分数为评价指标,进行对A股市场预测哪些公司可能会实施高送转.

全文