乳腺癌是世界上常见且致死率高的癌症。本文在充分考虑化合物分子描述符之间的非线性关系的同时,建立了随机森林模型,对化合物的生物活性进行定量预测。为寻找最优分子描述符的取值,在轮盘赌策略的基础上采用遗传算法,对ADMET性质进行分类预测,通过预测结果提升拮抗剂生物活性的预测效率。研究结果表明:所建立的随机森林模型预测精度高,模型参考价值得到有效提升;通过多次迭代遗传算法,能够准确找到因变量的最优值,为抗乳腺癌药物的研究提供数据支撑和理论参考。