摘要

本发明属于临床数据分析技术领域,公开了一种基于多通道随机森林的小样本临床数据分类方法(DASSMRF,Data Amplification and Semi-Supervised Multi-channel Random Forest)及系统。通过数据扩增方法对小样本临床数据进行数据扩增以扩大临床数据的容量,生成大量无标签的扩增数据;结合半监督学习思想,通过多通道随机森林集成为扩增数据标记可信度高的类别标签;用带标签的扩增数据和临床数据一道组成训练数据集,训练分类器,提升其对临床样本的分类性能。