基于双向长短时记忆网络和注意力机制的RNA m5C甲基化位点预测

作者:胡梦; 李慧敏*; 唐轶*; 王煜; 陈鹏辉
来源:中国生物化学与分子生物学报, 2023, 39(02): 303-310.
DOI:10.13865/j.cnki.cjbmb.2022.12.1389

摘要

RNA 5-甲基胞嘧啶(m5C)修饰在许多生物过程中发挥重要的作用,对m5C位点的准确识别有助于更好地理解其生物学功能,所以识别m5C甲基化位点十分必要。尽管已发展了多种识别m5C甲基化位点的机器学习方法,但预测能力仍有待提高。本文基于双向长短时记忆网络和注意力机制,提出了一种预测RNA m5C甲基化位点的深度学习算法。用该方法在人、小鼠、酿酒酵母和拟南芥共4种生物的RNA m5C数据集上进行实验,m5C位点预测AUC值分别达到92.5%、99.7%、93.6%和86.5%。与现有预测方法相比,该方法具有较好的预测性能,并且具有更优的泛化能力,为RNA m5C甲基化位点预测提供了一种新方法。

全文