摘要

针对抗乳腺癌药物研发中ADMET占据比例过大且难以准确预测等问题,提出一种基于随机森林及深度神经网络模型的候选药物ADMET性质预测模型。模型在保留分子结构信息的前提下,能够减少特征冗余和样本维度,以随机森林算法及特征选择过程结合变量重要性评分方法,获取最优分子描述符变量特征。通过改进DNN模型结构中各层之间的快捷连接方式,更有效地保留分子结构信息。在公开数据集中进行对比试验,结果表明所模型在测试集中5种ADMET性质分类预测平均准确度可达89.15%,优于当前主流模型,具有更强的适用性。