为加强对互联网以及社交媒体的恐怖主义信息的甄别和处理,利用数据的爬取和分析甄别,分类恐怖主义信息。通过scrappy框架以及gensim工具包对数据进行爬取,得到了4个数据集,并且进行LDA(Latent Dirichlet Allocation)主题模型的建立,分别得到恐怖主义信息传播在4个不同领域中的主题分类,以及主题间的关系。实验表明,通过爬取可以有效鉴别出不同的恐怖主义信息主题,以及其在传播中的作用。