摘要
目的 建立抗乳腺癌候选药物的分子描述符与该药物拮抗雌激素受体α(ERα)活性的定量构效关系(QSAR)预测模型,预测具有更好拮抗ERα活性的新药物分子或指导已有候选药物的结构优化。方法 使用某药物企业提供的乳腺癌ERα拮抗剂数据,首先通过改进的随机森林对化合物的分子结构描述符进行变量选择,选取前20个对生物活性具有显著影响的分子描述符;然后利用支持向量回归构建20个分子描述符对药物拮抗ERα活性的QSAR模型,再采用差分进化算法来优化模型的超参数。结果 数据经随机森林进行变量选择后从729个变量变为20个变量;对于药物拮抗ERα活性的基于支持向量回归的QSAR模型的拟合优度(R2)为0.7407,均方误差(MSE)为0.7034;而经过差分进化算法优化的QSAR模型对于药物拮抗ERα活性的R2为0.935,MSE为0.1762。通过R2和MSE的检验,优化后的模型具有较好的稳健性与较高的预测精度。结论 通过建立化合物分子描述符与其拮抗ERα活性的QSAR模型,找到对乳腺癌治疗药物的药物活性有重要影响的描述符,可用来指导乳腺癌新型治疗药物的设计。
- 单位