摘要
抗癌肽能够抑制癌细胞的生长,诱导癌细胞的凋亡,且具有安全、高效、低成本等优点,已成为抗肿瘤药物研究的热点。针对湿实验方法识别抗癌肽技术复杂、效率低且成本高等问题,本研究提出了一种利用肽序列信息,结合长短期记忆网络(long short term memory networks,LSTM)模型来预测抗癌肽的方法。该方法仅需要将肽序列作为输入,采用文本处理中的字符嵌入方法,自动将序列影射到特征向量表示,模型自行抽取特征进行训练和预测。实验结果表明,该方法在测试集上的正确指数达到0.829, AUC (the area under ROC curve)值达到0.895,说明本方法能够有效地辅助抗癌肽的识别。
- 单位