摘要

目的:基于文献计量法评价机器学习算法在药物毒性预测中的应用现状,为相关研究和应用提供参考借鉴,以促进“医药+信息”学科的交叉发展。方法:以“毒性预测”、“定量构效关系(QSAR)”、“计算毒理学”、“机器学习”等为主题词,组合查询发表于中国知网、万方等数据库的相关文献,然后依据“所用算法种类”、“所应用的毒性预测环节”进行归类整理,对机器学习算法在药物毒性预测领域的应用现状进行综述。结果:共检索到相关有效文献122篇。机器学习已用于药物毒性预测的毒性数据集处理、药物信息表征筛选、预测模型训练等,其中应用于模型训练任务的算法次数与种类相较更多;虽然各种算法在药物毒性预测领域都有研究应用,而以支持向量机算法、随机森林算法与深度学习算法的应用较多;另外,文献多数认为基于深度学习或集成学习的模型预测性能较高。结论:机器学习算法在毒性预测领域中应用种类较多,而选择算法时需考虑的主要问题是数据集规模大小和算法运算速度,对异常数据、冗余数据、噪声数据的适应性以及算法的实现难度等;计算机辅助毒性预测相较传统的体内体外实验有着较多的优势,但仍有部分亟待解决的难题,包括医药数据相关板块的不少空缺、现有数据质量的亟待提升和药物信息表征如何选择等。

  • 单位
    江西中医药大学计算机学院