摘要

目的核糖核酸(ribonucleic acid, RNA)在许多生命过程中起着关键作用,它几乎参与了遗传信息转录和翻译的各个方面。镁离子(Mg2+)是RNA折叠成稳定三级结构所必需的,而且常常与核酶的催化活性有关。尽管实验解析的RNA结构越来越多,但实验确定RNA结构中的离子存在诸多困难。三维卷积神经网络(three-dimensional convolutional neural network, 3D-CNN)能够直接从原始数据中学习有用的特征,已被应用于一些基于结构的预测工作。为此本文拟提出一种基于3D-CNN的RNA结构上Mg2+结合位点的预测方法RNAMg。方法首先收集蛋白质数据库(protein data bank, PDB)中的RNA结构构建了高分辨率的非冗余RNA-Mg2+结合位点数据库(113个结构);随后,对每个结合位点建立局部坐标系,以周围微环境(碳、氧、氮、磷原子和电荷)构建5个特征通道,将RNA三级结构作为3D图像送入3D-CNN模型预测RNA-Mg2+结合位点;最后,使用五折交叉验证评估模型的性能。结果独立测试集上的结果表明,在识别RNA结构中的Mg2+位点上,RNAMg优于目前最先进的方法。结论 RNAMg可以识别出RNA结构中的Mg2+结合位点,对理解RNA折叠、核酶催化反应等各种关键生物学过程及相关疾病的产生机制有重要意义。