基于长短期记忆网络的抗癌肽的预测

作者:方春; 孙福振; 李彩虹; 宋莉
来源:山东理工大学学报(自然科学版), 2020, 34(03): 34-39.
DOI:10.13367/j.cnki.sdgc.2020.03.007

摘要

抗癌肽能够抑制癌细胞的生长,诱导癌细胞的凋亡,且具有安全、高效、低成本等优点,已成为抗肿瘤药物研究的热点。针对湿实验方法识别抗癌肽技术复杂、效率低且成本高等问题,本研究提出了一种利用肽序列信息,结合长短期记忆网络(long short term memory networks,LSTM)模型来预测抗癌肽的方法。该方法仅需要将肽序列作为输入,采用文本处理中的字符嵌入方法,自动将序列影射到特征向量表示,模型自行抽取特征进行训练和预测。实验结果表明,该方法在测试集上的正确指数达到0.829, AUC (the area under ROC curve)值达到0.895,说明本方法能够有效地辅助抗癌肽的识别。