摘要

针对在微核糖核酸(micro ribonucleic acid, miRNA)-疾病关联性研究中信息使用不充分,且过度依赖网络节点的相似度信息,预测准确率较低的问题,本研究提出了基于图卷积神经网络(graph convolutional neural networks, GCN)及拓扑特征的miRNA和疾病的关联预测计算模型GTMDA。该模型综合miRNA相似度矩阵、疾病语义相似度网络和miRNA-疾病关联关系矩阵,首先使用GCN和随机游走算法,分别获取miRNA和疾病的子图顶点嵌入特征及miRNA与疾病相似性网络的拓扑结构特征;然后将其输入多层感知器(multilayer perceptron, MLP),预测潜在关联性。结果表明,该模型的AUC值达到0.947 5±0.010 6,优于其他方法。此外,预测的前50个miRNA中,84%的乳腺恶性肿瘤、90%的食管癌和94%的肺癌得到了独立数据库的验证。因此,本研究模型可作为预测miRNA-疾病潜在关联的可靠模型。

全文