摘要

伴随着广告的普及,违法广告检测的意义重大。面对目前已有的违法广告检测方法仅能判断是否违法,而不能提取违法词并关联违法法条的问题,该文提出一种基于命名实体识别的违法广告词检测方法,此方法将触及违法条例关键词作为特殊的实体进行识别。具体包括以下步骤:首先使用BERT (Bidirectional Encoder Representation from Transformers)预训练模型提取动态字向量作为模型的输入,然后构建双向长短期记忆网络获取广告文本上下文的信息输出得分向量,最后结合条件随机场对标签进行限制,获取到最优标签。实验结果表明,这种基于命名实体识别的检测方法可有效地完成违法广告的检测,不仅可以提取违法词,而且还可识别出违法词触犯的相应法条。