摘要
RNA及RNA结合蛋白之间的相互作用在基因调控中扮演着重要角色。许多预测RNA-蛋白质结合位点的深度学习方法陆续提出。目前多数研究没有将RNA结合蛋白作为模型输入,限制了深度学习模型的规模。对此问题,提出一个带有RNA结合蛋白输入的深度学习模型,通过扩大训练集的规模挖掘RNA-蛋白质结合位点的公共知识。模型将RNA序列先后经过卷积神经网络和门控循环单元来得到序列特征;将序列特征与RNA结合蛋白的独热编码拼接,作为全连接层的输入;通过一个Sigmoid单元输出该RNA结合蛋白对RNA序列的结合概率。在两个权威数据集上,该方法相比其他模型均具有一定优势。
- 单位