摘要
针对现有SOS1抑制剂中新颖结构数量较少的问题,提出一种结合RNN及Transformer的改进分子生成算法RT。首先用ChEMBL数据集对Transformer模型预训练,通过数据增强方法提高模型学习分子表征的能力;然后用SOS1抑制剂对预训练模型进行微调,运用强化学习方法设计MRTX0902的衍生物,并与对Specs库进行虚拟筛选的方法比较生成分子的质量。结果表明,R-T算法能生成多样性高、易合成的候选SOS1抑制剂,多样性为0.693,可合成性为3.14。这表明其在生成新颖化学结构上的有效性。
- 单位