摘要
食品工业一直在积极地发现新的甜味分子,传统发掘方法费时费力,效率较低。该研究基于分子的甜味和分子结构相关的假设,利用文献、专利及数据库中的数据,建立甜味、非甜味分子数据集和甜度分子数据集,采用随机森林和支持向量机算法建立定性构效关系模型定性预测甜味分子;采用主成分回归、k最邻近回归、随机森林回归和偏最小二乘回归四种算法建立定量构效关系模型定量预测甜味分子的甜度。研究发现,随机森林算法模型的分类效果最好,接受者操作特性曲线下的面积为0.987,准确度为0.966;随机森林回归模型的甜度预测效果最好,决定系数为0.82,误差均方根为0.60。联用这两个模型在食品成分数据库中,发现542个具有甜味剂潜力的食品分子。
-
单位东北农业大学; 中国农业科学院农产品加工研究所; 现代教育技术中心