摘要

提出了一种基于深度学习的方法UCEfold,用于预测RNA二级结构。UCEfold使用了一种同时采用“序列”和“图像”作为深度学习模型输入来提取隐藏特征的全新方法,并在模型中加入了一定的先验知识来提高预测精度。我们同时在RNAStralign和ArchiveII两个数据集上测试了UCEfold模型,结果表明UCEfold性能显著优于传统方法,能够更加准确地预测带假结的RNA序列,并具有很强的泛化能力,有效解决了传统算法复杂度高,效率低下,且无法预测假结的瓶颈。随着越来越多更高质量的训练数据变得可用,我们的基于深度学习的算法将具有更加优异的性能。

全文