近年来恶意代码研究大部分都集中在恶意二进制文件的研究分析上,而原始的恶意源代码缺乏文档,过于晦涩难以阅读,研究人员缺乏技术专长来解释跨越多种编程语言的源代码文件,导致探索原始恶意源代码的静态分析的工作目前很少。本文引入NLP思想,将恶意源代码映射为文本文档,将代码词视为细粒度指标,转换为词向量,利用文本神经网络建立恶意源代码功能分类模型,结果表明,利用文本神经网络帮助自动分析恶意软件源代码相较于传统人工分类或机器学习分类方法有更具优势的研究效果。