摘要

DNA序列特异性是指DNA序列对特异性蛋白质的结合能力.基于深度学习的框架去预测DNA和蛋白质是否结合.首先对DNA序列进行词切分,然后利用词向量模型学习DNA序列词向量,将提取的序列词向量输入卷积神经网络以此提取高层特征,随后利用双向长短周期网络对序列特征进行再累积提取,最后用累积特征进行分类.本文在权威的690个数据集上进行了实验.实验结果与当今权威方法的结果相比具有很强的竞争力.