摘要
随着我国经济的快速发展,人们可支配收入增加,对投资股票市场的收益需求日益旺盛,借助数据挖掘技术可以从海量的数据中迅速地找到有价值的信息,帮助人们更加高效便捷地进行选股。由于决策树的选股模型准确度不高,所以在决策树的基础上加入主成分因子分析,以我国目前在A股市场上市交易的3241家公司股票的数据,利用决策树C5.0算法,结合主成分因子分析,对股票数据进行分析,最后对涨跌幅度程度不同的股票分为6类。结果表明:基于主成分因子分析的决策树模型较单一决策树模型具有更高的准确度,同时,所选取的AAA类,即极大程度跑赢上证50指数的股票,样本外测试的准确性良好,对于这一类股票,通过构建上证50指标的对冲组合,无论证券市场高涨还是低迷,均有较高概率获取超额收益。
-
单位金融学院; 福建江夏学院