摘要

分子虚拟筛选方法旨在找到一种可以与受体蛋白质进行相互作用并适当修改其生物学行为的活性分子。大多数分子虚拟筛选方法的先决条件是已知蛋白质的结构或小分子结合物。然而对于大多数蛋白质而言,这些信息都是未知的。因此,本文提出了一种名为Screener的基于蛋白质序列比对和活性分子相似性评估的分子虚拟筛选方法。Screener首先从受体蛋白质的序列出发,生成位置特异性频率矩阵特征、二级结构特征以及溶剂可及性特征,利用I-LBR程序对受体蛋白质的潜在结合位点残基进行预测;其次,根据预测的结合位点残基以及相关特征信息构建模板蛋白质库;然后,将所有与任意模板蛋白质相互作用的活性分子收集起来构成潜在的种子分子库;最后,利用分子2D指纹之间的相似性来对待筛选分子集进行排序,完成分子虚拟筛选。在基准测试集DUD40和DUD-E65上,Screener的平均EF1%分别为16.6和25.7,HR1%分别为44.1和67.6。基准测试结果表明Screener的虚拟筛选平均性能优于基于对接的虚拟筛选方法AutoDock Vina及基于结构比对的虚拟筛选方法FINDSITEfilt和PoLi。