摘要

本文主要针对300多个反映上市公司是否高送转的因子于3000多个上市公司的日数据与年数据的研究,利用机器学习的思想对因子进行筛选和对上市公司未来高送转的预测。首先,对年数据和日数据进行数据预处理后,利用向后逐步回归模型对大量因子进行筛选,其次利用因子分析法对逐步回归筛选出5个公共因子,这筛选出的5个公共因子可以很好的解释上市公司是否高送转的情况,在某种程度可以解释为5个公共因子所相关的因子即为上市公司实施高送转方案影响较大的因子。最后建立多元逻辑回归模型,对公共因子做进一步解释和对上市公司第8年实施高送转进行预测。通过机器学习的算法结合经济学知识和实际生活,最终得到了很好量化上市公司实施高送转方案影响较大的因子。并结合问题一选取的因子建立了逻辑回归模型预测上市公司第八年实施高送转的情况。通过建立训练集和测试集的方法对模型进行训练的方法,最终可以将模型的预测成功率稳定在80%。从经济学和实际生活进行考虑,该模型可以很好的预测出上市公司未来高送转的情况,具有很大的现实意义。