基于随机森林与Chemistry Development Kit描述符的P-gp底物识别

作者:马广立; 赵筱萍; 程翼宇
来源:高等学校化学学报, 2007, (10): 1885-1888.
DOI:10.3321/j.issn:0251-0790.2007.10.013

摘要

应用随机森林方法、开放源代码软件-CDK(Chemistry Development Kit)描述符与170个化合物的训练数据集[其中96个为磷糖蛋白(P-gp)底物],建立了P-gp底物的识别模型.研究了CDK描述符与P-gp底物识别的关系,结果表明,原子极化性和电荷偏面积等分子属性对P-gp底物识别起到重要作用.该模型对训练集的预测正确率为99.42%;对外部测试集(42个化合物,其中24个

全文