摘要

恶意软件是网络空间安全的重要威胁之一,安全厂商和从业人员发布了大量的恶意软件分析报告。从报告中自动化识别并提取出恶意软件行为与能力描述的相关文本语句,能够帮助分析人员快速了解恶意软件的关键信息。本文使用一种基于多尺度融合的卷积神经网络模型抽取上述信息,该模型仅使用预训练词向量作为输入,利用卷积层提取特征,减少对人工特征依赖。基于Phandi等人构建的数据集MalwareTextDBv2.0数据集进行测试,准确率为71.33%、F1值为66.48%。相对于该数据集上的其它识别方法,本模型具有更高准确率和F1值。