摘要
针对现有网络安全文本按照主题分类,导致主题之间联系不紧密,文本资源缺乏系统性的问题。论文提出在网络安全知识体系下,按照知识点对文本进行分类。同时,提出Albert-TextCNN模型进行知识点提取,使用Albert模型提取输入文本的词向量,在减小参数量的前提下,输出了包含丰富语义的词向量,并使用TextCNN进一步提取词向量的局部语义特征,最后辅以网络安全知识体系,根据知识点标签之间的包含关系,进一步提升了模型性能。实验结果表明,该模型各项指标均高于实现了同类型单个模型的性能。
- 单位
针对现有网络安全文本按照主题分类,导致主题之间联系不紧密,文本资源缺乏系统性的问题。论文提出在网络安全知识体系下,按照知识点对文本进行分类。同时,提出Albert-TextCNN模型进行知识点提取,使用Albert模型提取输入文本的词向量,在减小参数量的前提下,输出了包含丰富语义的词向量,并使用TextCNN进一步提取词向量的局部语义特征,最后辅以网络安全知识体系,根据知识点标签之间的包含关系,进一步提升了模型性能。实验结果表明,该模型各项指标均高于实现了同类型单个模型的性能。