绝大部分非编码区的基因功能尚不清楚,而许多的遗传变体就存在这些区域,如何识别与疾病相关的变体仍是一个挑战。已有基于支持向量机的算法CADD被提出,它可以注释编码和非编码区的变体,但是该方法未能捕获特征间的非线性关系。为了解决此问题,设计了一个混合卷积网络和全连接网路的模型,能很好地捕获特征之间的非线性关系。在测试集上,方法达到了最高的66. 44%准确率。