摘要

蛋白质相互作用(PPI)网络中的蛋白质功能预测、蛋白质交互预测和复合物识别是生物信息学的重要任务,非常依赖于对蛋白质的编码。由于PPI网络是由少量中枢节点主导的无标度网络,传统欧氏空间嵌入方法难以捕捉网络中的层次结构,导致蛋白质编码效果并不理想。提出一种基于双曲空间图嵌入的蛋白质自编码器Protein-HVGAE,该模型采用两个双曲图卷积网络作为编码器,计算隐藏层的均值和方差,并在不同曲率的双曲空间中捕捉网络的层次结构,以区分各节点的低维表示;采用Fermi-Dirac函数做解码器,在双曲空间上通过内积运算重构网络。实验结果表明,该模型在3个PPI数据集中的两个下游任务(PPI预测和蛋白质功能预测)上的表现优于以往在欧氏空间中的编码方法(在PPI预测中AUC值高于VGAE模型0.07左右,在蛋白质功能预测中Macro-F1值高于VGAE模型0.02左右)。