摘要

提出了一种神经肽预测集成算法。整合了9个特征描述符与5个机器学习算法,生成了45个基线学习模型。第一层对这45个基线模型进行特征选择;第二层根据基线模型对的准确度和皮尔森(Pearson)相关系数之和选择8个基本学习模型;第三层将这些学习者的输出输入到逻辑回归,极限梯度提升等分类器中进行最后一步的选择用以训练最终模型,并将输出作为最终预测结果。在测试数据集上的准确度为0.9169,高于现有的模型。

全文