摘要

本发明公开了一种基于联合训练的含缺失值基因微阵列的聚类方法,包括以下步骤:计算基因微阵列数据的缺失率,剔除缺失率超过10%的基因点,然后将基因微阵列数据划分为训练集和测试集;构建深度神经网络,包括Sequence-To-Sequence编码-解码网络和对抗学习模块,并使用训练集对构建的深度神经网络进行训练以确定深度神经网络的参数;将测试集输入到深度神经网络中,获得测试集中含缺失值基因微阵列数据的深层特征表示;最后对深层特征表示应用K-means聚类算法,获得含缺失值基因微阵列的聚类结果。本发明可为基因表达数据聚类提供一种端到端的框架,解决了传统方法需要选择合适的填补方法与聚类方法组合的困难。