摘要
环形RNA是一类广泛存在于真核细胞中的内源性RNA分子,没有5’末端帽子和3’末端polyA尾巴,以共价键连接形成封闭环状结构.一直以来,环形RNA被认为是一类不能翻译的非编码RNA.然而近年来有研究报道,环形RNA能够编码蛋白质从而调控重要的生命活动,引起了研究者们的注意.运用机器学习的方法,基于环形RNA的序列与结构特征,使用XGBoost、随机森林和支持向量机组合而成的综合分类模型,预测环形RNA编码蛋白的潜能,平均预测准确率达到86.66%,为实验研究人员提供可靠的参考,有助于发现更多可编码蛋白的环形RNA.
-
单位南京航空航天大学; 自动化学院