摘要

针对解决大数据技术实验平台建设投入不足和不易用问题,通过使用开源MLSQL框架,探讨如何更简便、高效的利用大数据技术实现需求的方案。首先,采取对数据中台框架进行解构,阐述实验平台研发的技术路线,然后,以文本分类的实验进行案例分析,通过使用随机森林算法构造分类模型,最后,调控随机森林算法中的参数进而使得模型达到最优化,实验结果表明,该随机森林算法构造的分类模型可适用于多种分类问题,同时可以通过调参来使得模型贴合问题的实际,为后续的分类算法研究提供可借鉴性材料以及具体的提供一种实验平台研发流程的可行方案。