摘要
考虑到单个特征对标签的有效性及多特征之间的信息冗余问题,提出一种联合互信息和改进PCA的双重降维方法。首先利用互信息对众多的特征进行初步筛选,舍弃一部分对标签信息贡献较低的特征,其次使用累积方差贡献率和复相关系数共同确定主元个数的主成分分析法进行二次降维,不仅保证了主元模型的信息容量,同时也避免了过多噪声的参与,从而保证了预测过程的准确性。最后通过神经网络对实际股票数据进行预测,表明了本文提出的降维算法的有效性。
-
单位数学学院; 华南理工大学; 信息与计算科学系