摘要

针对蛋白质质谱数据检索研究中由于样本单一、数据不平衡导致传统的相似性匹配检索方法效率低且精度不高的问题,提出一种基于复杂的放回抽样(Flex-Bootstrap)和多次卷积神经网络(Multi-CNN)与深度神经网络(DNN)融合模型的检索方法,并与DNN模型、CNN与DNN融合模型相比较。Flex-Bootstrap方法结合Multi-CNN与DNN融合模型应用于蛋白质质谱数据种类预测时取得了较好的效果,其测试集的准确率提升至98.82%,损失函数值降低至0.0397。该模型不仅有效解决了使用DNN模型、CNN与DNN融合模型进行数据检索时存在的欠拟合问题,同时提高了预测的准确率以及质谱数据库的搜索效率。