摘要

针对菜谱工艺标签标注的需求随着网络平台上中文菜谱数量增多而不断增加,使用机器学习搭建了文本分类模型,实现了工艺标签的自动标注。该模型使用TF-IDF、TextRank两种方法进行特征降维,与常见的三种机器学习分类器朴素贝叶斯(NB)、逻辑回归(LR)、支持向量机(SVM)进行组合,组成了6种模型。获取网络上的中文菜谱整理成实验数据集,通过实验验证了所提模型的有效性,为菜谱工艺标签的自动生成提供了可行的解决途径。

全文