四种机器学习算法预测大豆蛋白质定位对比研究

李佳楠; 高兴泉; 李卓; 滕小华; 黄斌; 张继成; 唐友<sup>*</sup>

摘要

为探索不同缺失程度大豆蛋白质亚细胞定位预测的有效方法，提升大豆蛋白质亚细胞定位预测能力，本研究以1万条已知亚细胞定位位置的大豆蛋白质序列数据为研究对象，进行5%、10%、15%、20%和30%不同缺失比例完全随机缺失，分别运用SVM算法、朴素贝叶斯算法和随机森林算法和决策树4种机器学习算法预测缺失序列的亚细胞位置，对原始位置和预测后的位置进行相关性分析，对比分析不同算法的准确性和性能。结果显示：随机森林算法预测的准确率最高；朴素贝叶斯算法的运行速度最快；朴素贝叶斯算法的运行内存最小。在不考虑运行时间和运行内存因素，且对预测的准确率要求较高的情况下，随机森林算法的预测效果要优于另外3种算法；同种情况下，若对运行内存要求较高时，可优先考虑朴素贝叶斯算法。结果说明不同机器学习方法在不同缺失程度的预测需求下的适用性，可应用于大豆蛋白质数据的定位预测。

单位
吉林化工学院; 吉林农业科技学院; 东北农业大学

收藏分享被引浏览

更新时间：2024-03-20 23:31

四种机器学习算法预测大豆蛋白质定位对比研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友