一种自适应序列长度的RNA二级结构深度预测方法

吴宏杰; 汤烨; 陆卫忠<sup>*</sup>; 崔志明; 付保川; GAO Zhen

摘要

RNA二级结构预测是结构生物信息学中的一个重要问题.带假结的RNA二级结构预测,由于复杂的假结结构,更是增加了预测的难度.传统的机器学习方法受限于学习模型的结构,输入特征数目必须固定.大部分方法将不同长度的序列统一截断后进行训练,这不仅导致有用信息丢失,而且并破坏了生物序列完整性.针对该问题提出了一种适应序列长度的深度递归神经网络模型,构造了序列长度自适应模块及训练算法,从而不需要截断.同时,由于实际样本比例不均衡,采用了动态加权方法进行改善.随后,在权威数据集RNA STRAND上与四种优秀方法进行了四组比较实验.实验结果表明,本方法的正确率和M atthew s相关系数比定长LSTM方法分别提高了1. 6%和3. 3%;比其它四种典型方法提高了13. 6%和14. 8%.

单位
苏州大学; 苏州科技大学

收藏分享被引浏览

更新时间：2024-04-11 13:01

一种自适应序列长度的RNA二级结构深度预测方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友