病历数据的分类方法及系统

作者:顾东晓; 李童童; 江政; 王晓玉; 梁昌勇; 李兴国; 杨雪洁; 钟金宏; 杨颖; 陆文星; 蒋丽; 赵树平; 徐健; 吴勇
来源:2019-03-11, 中国, ZL201910178672.4.

摘要

本发明实施例提供了一种病历数据的分类方法及系统,对原始的病历数据进行预处理,得出能够与分类器匹配的数据集;然后,将特征选择后的数据集随机分为指定数量个大小相同的数据块,将各数据块分为训练集和测试集后,分别输入到对应的分类器中;随后,基于TPE算法,对全部分类器通过加权投票表决的方式进行预测,在运行指定次数的TPE算法后,选择验证误差最小时的分类器数量为最优分类器数量;最后,将最优分类器数量输入至深度级联森林模型中,深度级联森林模型进行逐次运行直至满足预设精度,获得病历数据的最优分类结果。本发明实施例的技术方案对数据量的要求不高,且易于训练,还具有适应性强的优点。