摘要
目的 使用MolMapNet构建深度学习(deeplearning,DL)模型,预测化合物对23个小样本(已知活性数据<250)G蛋白偶联受体(G-protein coupled receptors,GPCRs)的结合活性,辅助发现GPCRs的新型药物。方法 从多个数据库搜集小样本GPCRs的活性数据集并进行预处理,使用MolMapNet构建DL模型;将建立的模型与已公布DL模型和ML模型进行比较;用神经肽S受体专利化合物对构建的模型进行评估。结果 构建了23个小样本GPCRs靶点的单回归模型,在10折交叉验证测试下,构建的模型在测试集上的均方根误差为0.373 6~1.199 8(其中20个<1),平均绝对误差为0.299 4~1.008 3(其中21个<1),R2为0.136 9~0.810 7(其中15个>0.5,9个>0.6);与已发表的大样本GPCRs(已知活性数据>250) DL模型和小样本靶点的ML模型相比,显示出相当的性能;使用构建的模型对专利中化合物进行活性预测,模型表现良好。结论 构建的23个回归模型能够预测化合物对特定靶点的生物活性,具有筛选结构新颖的药物的潜力,MolMapNet可用于小样本GPCRs的活性预测。
- 单位