基于数据融合的细菌素发掘及类别判定模型

作者:杨慧慧; 李柏林; 李航; 陈昊; 刘程国*; 王玉堂
来源:中国乳品工业, 2021, 49(08): 21-64.
DOI:10.19827/j.issn1001-2230.2021.08.004

摘要

从现有文献以及数据库中收集细菌素信息,结合数据库技术建立细菌素信息数据库。通过MOE软件和E-Dragon平台生成分子描述符。基于随机森林(Random forest, RF)和支持向量机(Support Vector Machine,SVM)建立细菌素发掘模型,其中,RF算法建立的细菌素发掘模型识别效果最好,准确率(Accuracy, Acc)为0.9187。基于随机森林和K最近邻(k-NearestNeighbor, kNN)算法建立细菌素类别判定模型,其中,KNN模型准确度最高,为0.9000。根据建立的模型预测出7种可能的细菌素,并判定它们多数为Class IIB类。

全文