摘要

在国内政务大数据高速发展的背景下,充分利用大量无标注的公共安全领域政策公文文本数据,有效提取文本的关键信息,对提升城市安全治理能力有重要意义。因此,提出一种基于深度强化学习的公共安全领域文本关键词提取模型,通过无监督的方式快速实现文本内容的标签化,以提升用户对公共安全领域文件或事件的检索能力。文章以log-sum范数正则项作为该模型损失函数的稀疏约束,以引导策略网络学习到保留重要词汇、舍弃非重要词汇的策略。同时设计了一种mini-batch大小可变的模型训练方法,通过设置不同的mini-batch大小控制策略网络学习的难度,从而提高策略网络的泛化能力。性能对比结果显示,该模型在测试集的关键词提取任务上优于传统无监督关键词提取方法。