摘要
目的与意义:由于目前体育赛事行业高速发展,无论是赛事数量还是参与人群,都有快速增长的趋势,但是运营水平和经验的不足,使市场上大量的体育赛事质量参差不齐。该实验通过参赛者的赛后反馈,建立一个参赛用户的情感分析器,通过机器学习的方式,监测用户对于某项赛事的反馈情况,从而做到信息预处理的效果,未来还可以通过分析器对于区域用户进行监测,对未来赛事走向、筹办设计等进行有效支撑。方法与过程:实验使用Python对数据进行处理,使用jieba分词工具对评论语句进行拆分,通过sklearn中的TfidfVectorizer和LogisticRegression包对数据进行中文语言处理和文字向量化,最终达到自然语言处理的目的。结果与结论:从结果来看,此次实验搭建的预测模型准确率较低,存在数据集的有效性问题、数据集的信息来源问题、评分量表分散问题等,但这也仍给未来的研究提供了一种可能,未来应在源数据的收集中做到平均分层和人工分类,从而进一步优化模型,提高其预测准确率。
-
单位首都体育学院