摘要

生物富集因子(BCF)是REACH法规要求的生物积累危害评价指标的关键参数,用实验的方法测定BCF值人力物力花费较大,而用计算的方法预测BCF值可以有效地替代昂贵的实验过程。该研究使用E-Dragon计算了数据集中每个分子的1 666种描述符,并用筛选后的描述符与lgBCF建立了QSAR模型:采用随机森林与支持向量机建立的分类预报模型,随机森林分类模型的准确率为0.89、敏感度为0.89;用基于准确率递减和基尼系数方法的随机森林分类模型筛选出对lgBCF值有重要影响的30个描述符,这些描述符包括ALOGPS_lgP、MATS6v、TPSA.NO.、GATS7v等;ALOGPS_lgP和ALOGPS_lgS是用支持向量机分类模型筛选出的对lgBCF值有重要影响的描述符。

全文