摘要

越来越多的证据表明,环状RNA (circular RNA, circRNA)在人类复杂疾病发病机制和许多重要生物学过程中发挥不可或缺的作用.确定环状RNA与疾病之间关联对于复杂人类疾病的诊断和治疗具有重要的潜在价值.然而,传统的湿实验方式通常是盲目、低效、耗时且昂贵的,往往还伴随着高的假阳性率.因此,迫切需要有效和可行的计算方法来大规模预测潜在的环状RNA–疾病关联.本文通过结合图神经网络的高阶图卷积网络算法与随机蕨分类器对环状RNA与疾病之间的关联关系进行预测.该方法能够从环状RNA和疾病多种属性信息构建的多源相似性网络中,有效抽取具有高阶混合邻域信息的高级特征,并对其进行准确分类.在5折交叉验证实验中,该方法在CircR2Disease数据集上取得了93.75%的AUC得分.此外,在案例研究中,该模型的预测结果得到了生物湿实验的支持,预测得分前15的环状RNA–疾病关联中的13个在最近发表文献中得以证实.这些优异的结果表明,所提模型是预测环状RNA–疾病关联的有效工具,并且可以为生物湿实验提供理论依据和高可信的环状RNA候选生物标志物.

全文