摘要

目的 收集单细胞转录组数据集,评估单个细胞和细胞簇水平的两类细胞类型自动化注释方法,探索不同应用场景下合适的方法。方法 收集细胞系、组织(小鼠、人)、患者外周血等4个不同生物学层次的单细胞转录组数据集,以F1-score、漏检率及运行时间作为性能指标,评估3种同时具有2个尺度的自动化注释工具scmap、SingleR、CelliD中6个注释方法的性能。结果 通过对比发现,小鼠全组织55种细胞亚型的注释准确率呈现明显差异。单个细胞尺度注释方法普遍性能较优,尤其是对免疫相关细胞亚型的分类。具体单个方法中,scmap-cell在大多数场景中注释准确性最佳,但随着细胞数增多其速度明显缓慢。SingleR-cluster在面对基因dropout时表现出最稳定的准确性。SingleR利用小规模参考集进行注释有明显速度优势。结论 研究结果为不同单细胞转录组数据集自动化注释方法选择和应用提供了参考。