摘要
鉴于湿实验方法已无法满足快速鉴别苦味肽的需求,提出一种新颖的融合了传统手工特征和预训练深度特征的预测方法Bitter-Fus。该方法首先使用预训练蛋白质序列语言模型自动地从多肽序列中提取深度学习特征,然后将该特征输入长短期记忆(LSTM)网络中进行降维处理以保留与多肽序列最相关的深度特征,最后将降维后的深度特征与传统氨基酸组成(AAC)方法提取的手工特征融合并输入前馈神经网络中构建预测模型。验证实验结果表明:预测方法Bitter-Fus在10折交叉验证测试中获得了0.902的准确性和0.805的马修斯相关系数,在独立数据集测试中准确性和马修斯相关系数分别达到0.930和0.862,明显优于当前最先进的苦味肽预测方法BERT4Bitter和iBitter-SCM。
-
单位食品与生物工程学院; 郑州轻工业大学