基于双向门控循环单元的5-甲基胞嘧啶位点预测

作者:黄修威; 方中纯*; 李海荣
来源:中南民族大学学报(自然科学版), 2023, 42(06): 768-774.
DOI:10.20056/j.cnki.ZNMDZK.20230607

摘要

5-甲基胞嘧啶(5-methylcytosine, m5C)是一种重要的转录后修饰,大量证据表明,m5C在许多生物学过程中起着至关重要的作用.准确鉴定m5C位点有助于更好地了解其生物学功能.为此提出了一个名为pm5C-BGRU的模型,该模型通过拼接独热编码(One-hot encoding)和核苷酸化学性质(nucleotide chemical property, NCP)进而对RNA序列进行特征提取,并基于双向门控循环单元(Bidirectional Gated Recurrent Unit, BiGRU)来识别m5C位点.将该方法在人类、小鼠和拟南芥三个物种的m5C数据集上进行建模和测试,并对照已有的预测模型进行评估.结果表明,pm5C-BGRU在交叉验证和独立数据集测试中均取得优异效果,该模型有望成为鉴定m5C位点的有力工具.

全文