摘要

随着移动互联网的普及,公众更加频繁地使用社交网络分享生活并表达思想和感情。推特作为拥有全球最大用户基数的社交平台,沉淀了非常丰富的用户和文本信息。文章使用Sentiment140数据集对推特文本信息进行分析,从不同角度对数据集进行探索性数据分析,并通过F1值评估对比不同的特征提取方法和分类算法,最终确定了最佳的特征提取和分类参数。文章使用的分析流程和分析结果可作为文本情感挖掘的参考,为基于文本信息的情感分类任务以及精神疾病如抑郁症等的诊断提供助力。

全文