摘要
新型冠状病毒(SARS-CoV-2)的快速变异导致不断出现新的毒株.已有研究表明SARS-CoV-2的S蛋白受体结合域(Receptor Binding Domain,RBD)与宿主ACE2的结合亲和力与病毒的侵染能力相关.随着新型冠状病毒在全球的持续暴发,出现了大量RBD多点突变的新毒株.通过生物试验方式获得突变毒株RBDACE2结合亲和力费时费力,远远落后于突变株的积累,不能满足对该病毒实时监控的需求.为了快速预测具有多点突变毒株的结合亲和力,设计了一种深度神经网络模型.该模型首先结合卷积神经网络、循环神经网络与注意力机制,从RBD序列上学习关键特征并预测RBD-ACE2的结合亲和力;其次在真实数据集上对模型进行训练和评估.实验结果表明模型可以有效地预测关切变异株的RBD-ACE2结合亲和力,也有助于对SARS-CoV-2突变株的传播能力进行监控.
- 单位