摘要
应用于中医脉象信号分类研究中的多种方法提取了大量复杂特征,但使用时由于缺乏系统分析而难以在算法中高效利用,本文提出了一种基于随机森林的脉象信号特征评估降维方法。首先,提取常用的脉象时域、频域以及时-频域特征共93维;随后,使用随机森林算法,基于Gini指数对各个特征重要性进行排序,并使用支持向量机(SVM)、反向传播神经网络(BP-NN)以及随机森林(RF)算法验证排序的正确性,最后,结合序列前向选择算法,根据算法的分类准确率变化进行特征选择。实验结果表明:基于随机森林算法的脉象特征重要性排序可行,且进行特征筛选后,特征维数从93维降低到13维左右,对平、实、弦、滑四类脉象的分类,SVM和BP-NN的准确率均提高了10%以上,对特征冗余性不敏感的RF算法分类准确率也提高了4.5%,该方法可用于脉象信号分析中大量特征的评估降维,可显著提高算法的分类准确率和运行效率。
- 单位