摘要
G蛋白偶联受体(GPCRs)是最重要的药物靶标之一,约占市场上药物靶标的34%。药物发现过程中,配体生物活性的准确建模和解释对于筛选苗头化合物至关重要。研究表明,同源的G蛋白偶联受体能提升配体分子生物活性的预测性能和可解释性。提出了一种新的方法 GLEM,用多任务下的深度迁移学习来预测配体的生物活性,并通过组稀疏来识别相关的关键子结构。GLEM方法在9组30个具有代表性的人类GPCR数据集上进行了实验,这些GPCRs涵盖了大部分人类GPCRs的子家族,每个GPCR数据集都包含60~3 000个配体。实验结果表明,GLEM方法在绝大多数数据集中都获得了最好的性能。与单任务学习方法相比,GLEM方法在r2上平均提升了31.72%;与深度学习方法相比,GLEM方法在r2上平均提升了22.45%。此外,还评估了不同数量的训练样本对模型性能的影响,实验发现GLEM方法在小样本情况下表现最好。
-
单位常州市第一人民医院; 南京邮电大学; 通信与信息工程学院