摘要

人体肠道吸收性(human intestinal absorption,HIA)是衡量药物口服生物利用度的重要标志之一。利用人工智能方法在药物发现早期对药物的HIA进行预测评估,能够加速药物发现过程并且降低成本。本研究分别使用分子模拟软件MOE(molecular operating environment)的2D、3D描述符和ECFP4(extended connectivity fingerprints)对分子进行表征,针对2 061条HIA数据建立支持向量机(SVM)、随机森林(RF)、深度神经网络(DNN)等8种模型。结果表明,基于2D、3D描述符和ECFP4指纹的组合描述符构建的SVM模型在各项评价指标上进行综合评价后是最优的,最优模型的受试者工作特征曲线下面积(AUC)、马修斯系数和Kappa系数分别为0.94,0.75及0.74。综上,本研究建立一个鲁棒性高、泛化能力强的预测HIA性质的机器学习模型,该模型可以用于为药物药代动力学性质研究提供指导及早期的分子筛选。