摘要
[目的/意义]开源情报分析是情报工作的重要内容。在大数据时代,事件信息能够短时间内在互联网上呈指数性增长,以人力为主的传统情报分析技术的局限性越来越明显。因而自动化的文本挖掘技术愈发举足轻重。[方法/过程]通过前置处理、特征淬取、数据分群、标记处理与情报挖掘等阶段,运用自组织映射算法进行数据关联分析,使用主题侦测和特定事件侦测两种技术进行情报挖掘,以期建立基于文本挖掘技术的自动化开源情报分析方法。[结果/结论]遵循上述程序与技术,借助标准数据集Reuters-21578进行事件侦测实验,运算结果满足了特定事件情报分析的需求。值得注意的是,数据集文件数量的均匀程度会显著影响类别准确度。
-
单位西北政法大学; 浙江警察学院