据调查,聊天消息和推文信息是最容易被检测出包含侮辱性词汇的数据集,在本项研究中,收集了一些具有侮辱性词汇的数据集,然后思考根据这些数据集的上下文判断会产生什么结果,一般情况下,如果数据集内容模棱两可,那么就需要在特定的背景下进行解释。利用BERT、SVM和BiLSTM模型进行上下文分类训练,比较结果发现,基于BERT的上下文感知分类,更适合类似的实际应用场景。