摘要
目的 利用人工智能算法辅助药物设计,实现拮抗乳腺癌候选药物的分子描述符筛选、ERα回归预测、ADMET分类预测。方法 针对乳腺癌候选药物筛选问题,以化合物对抑制乳腺癌靶标的生物活性及其ADMET性质出发,基于获取的1 974种化合物数据,分别利用稀疏贝叶斯学习与随机森林算法进行两阶段筛选,得到不具备强相关性的前20个对生物活性最具显著性影响的分子描述符;随后以筛选后的数据及其PIC50值为基础建立了QSAR模型,基于灰狼优化的核极限学习机算法对新化合物的生物活性进行了预测,横向对比11种常见机器学习算法,同时利用GBDT算法构建了ADMET分类模型。结果 GWO-KELM模型具有更高的拟合优度与更低的均方误差,而且药物性质识别的4个模型预测准确率均保持90%以上。结论 所建模型能够有效分析并预测化合物性质,为抗乳腺癌候选药物的研发提供参考。
- 单位