摘要
环状RNA是一种具有环状结构并且表达水平与多种疾病有关的非编码RNA分子,挖掘环状RNA与疾病之间的内在关联关系在生命医学研究中具有重要意义。基于图注意力机制,该文提出了一种由图注意力网络(GAT)、编码器-解码器(AE)和全连接神经网络(DNN)结构组合的端到端深度学习模型GATECDA来预测潜在的环状RNA与疾病的关联关系。在包含739个关系的CircR2Disease数据集上,GATECDA模型五折交叉验证实验取得了ROC曲线下面积AUC为0.961 8,AUPR为0.903 2,衡量在非平衡数据上性能MCC指标达到了0.757 6的优异结果,综合性能在同领域预测模型中表现出色。表明基于深度学习图表示学习的策略有助于提升环状RNA与疾病关联关系预测模型的综合性能,同时端到端的学习模型更易于训练与泛化到其他问题中。在预测的结果得到的前30个环状RNA与疾病的关联关系中,有25个在最近医学文献中有支持。表明人工智能方法可以为医学研究筛选与疾病相关的标志物提供新的角度。
- 单位