摘要

单细胞RNA测序技术将大量基因表达谱测序出来,识别细胞类型或转录标记成为研究重点。基于聚类方法假定聚类中所有细胞属于同一类型,因此可进行集群标记,但这种假设通常是错误的,集群中除了主要细胞类型外,还包含少量占比的多种细胞类型,所以设计一种细胞类型分类器很有必要。基于此,提出一种基于特征选择的多核超图神经网络分类方法(HVG-MHGNN)。对单细胞数据进行预处理,选择高度变异基因(HVG);构造多种相似距离进行多核合并;构建超图学习模型;采用多类型scRNA-seq数据集验证该方法。实验结果表明,与主流分类方法scPred、原始超图HGNN和多核HVG-MHGNN对比,HVG-MHGNN在单细胞数据集上准确率及时间效率都有所提升。