摘要

预测药物在血浆中的蛋白结合率,有助于了解药物的药代动力学特征,对药物发现的早期研究有重要的参考价值。本研究收集了2 452个临床药物的血浆蛋白结合率信息,用Molecular Operating Environment(MOE)和Mordred两种软件计算分子描述符,将算得的分子描述符作为模型的输入特征。使用极端梯度提升(extreme gradient boosting,XGBoost)算法和随机森林(random forest,RF)算法构建机器学习模型。结果表明,与MOE相比,将Mordred计算的分子描述符作为模型的输入,构建的模型预测性能更优。使用XGBoost算法和RF算法构建模型的预测性能结果相近,最优模型的R2均为0.715。此外,根据研究结果得出药物血浆蛋白结合率与药物分子的一些理化性质参数,如水溶性,辛醇/水分配系数以及共轭双键密切相关。通过这些参数预测药物血浆蛋白结合率具有方便快捷的优点,可以为相关药代动力学研究提供参考依据。