<正>随着科技水平的不断提高,研究者们可以获得有关疾病的各类数据,例如基因组学、蛋白质组学、代谢组学、影像学等。这些海量数据的获得使得我们对疾病的了解更加深入。但随之而来的问题是,研究者们如何从海量数据中提取有用的信息,从而集中资源进行深入的研究,成为科研工作者面临的新挑战。近年来硬件技术的飞速发展和存储数据能力的增强,促进了大数据机器学习方法的发展,研究者已经将机器学习方法,特别是深度学习,应用于这类复杂数据的分析[1-4]。自编码