摘要

工业大数据具有多模态和强关联等特性,这给数据分析与应用带来了新的挑战。如何根据工业应用需求的特点实施有效的数据分析过程通常是一项非常复杂、耗时耗力的任务。针对该问题,本文提出了一种面向工业互联网数据分析的机器学习工作流推荐方法。该方法以已有解决方案为起点,将其所使用的数据集和机器学习工作流作为推荐参考,基于Doc2vec模型与最大平均差异方法计算文本描述相似度与数据分布特征相似度,可根据当前数据分析任务需求,推荐合适的已有解决方案中的机器学习工作流。仿真实验说明了该方法的有效性。