摘要
为了开发快速、高效和智能的抗高血压肽(anti-hypertensive peptides, AHTPs)识别工具,针对AHTPs的识别,构建基于多源特征和深度学习的识别模型。利用新增强分组氨基酸组分(novel enhanced grouped amino acid composition, NEGAAC)、约简的二肽组分(reduced dipeptide composition, RDPC)、二肽频率与预期平均值之间的偏差(dipeptide deviation from expected mean, DDE)、氨基酸物理化学性质的距离变换(amino acid physicochemical properties-based distance transformation, AAP-DT)和BLOSUM62编码对肽序列进行特征提取。采用双向门控循环单元(bidirectional gated recurrent units, BiGRU)对蛋白质特征进行深度学习,进而有效识别AHTPs。在10-折交叉验证下,基于多源特征和深度学习的识别模型在基准数据集和独立数据集上的识别精度达到96.78%和98.72%。
- 单位