摘要

随着生物医学和医疗保健的大数据增长以及电子病历记录(EHR)数据的大量数字化,对医学数据的准确分析将有助于早期疾病检测.但是,当医学数据的质量不完整时,分析准确性会降低.为了捕捉潜在复杂信息,提高准确率,越来越多人选择使用神经网络预测模型,其中RNN的变体如LSTM和GRU预测效果不错,但模型需要特别苛刻的条件,首先数据必须完整无缺失,其次时间步长固定,且模型本身不捕获时间信息.在本文中,我们在已有的变体中拓展了模型,共讨论了四种LSTM和GRU的变体模型,分别是LSTM-D、GRU-D、P’-LSTM-D和P’-GRU-D,它们都能直接处理带有缺失的数据.我们从大型公共重症监护医学数据库MIMIC III中提取了10 315个充血性心力衰竭病人的数据,比较了四种模型的效果及收敛速度.发现GRU-D和LSTM-D两种模型的表现效果极佳,在以呼吸频率为临床结局的任务中,平均AUC能够到达0.96,另外GRU-D比LSTM-D的收敛速度要快一些.