摘要

本文提出一种金融时间序列预测的数据降维与信息融合计算智能模型-PANK模型。该模型由三个部分组成:(1)主成分分析(Principal Component Analysis,PCA),用于减少冗余信息;(2)仿射传播聚类(Affinity Prop-agation,AP),用于找到聚类中心和相应的聚类作为特征提取;(3)嵌套式k-最邻近元(Nested k-Nearest Neighbor,Nested KNN)用于回归预测。PANK模型先采用滑动窗口技术截取最近期的金融时间序列作为输入数据,再经过PCA减少冗余信息,提取富含有效信息的主成分,并将其放入AP中进行聚类,最后采用两层嵌套式NestedKNN预测。本文特别提出了一种新的嵌套式Nested KNN,可以有效解决KNN中的两个主要问题:计算量大和不均衡样本问题。通过对模型在欧元兑美元汇率和中国沪深300股指上的实证,结果表明PANK预测模型可达到80%的最佳命中率。

  • 单位
    西南财经大学天府学院; 金融学院