分层文本分类在警情数据中的应用

作者:殷小科; 王威; 王婕*; 张沛然; 乐汉; 林基伟; 张海婷
来源:现代计算机(专业版), 2021, 27(23): 86-90.

摘要

分层文本分类在现实中应用比较广泛,在数据不理想的情况下,充分利用分层结构信息对提高分类效果有很大的帮助。针对警情数据,为了充分利用其现有的分层结构信息,缓解数据严重不均衡的问题,提出了一种基于BERT的迁移分层文本分类模型,利用BERT预训练模型充分提取警情领域相关信息,用于分层文本分类。实验结果表明,利用结构信息和迁移学习对结果都有不同程度的提高,尤其是对数据少的类别。

  • 单位
    上海市公安局