摘要
【目的】针对目前对美国出口管制分析的不足,提出一种融合多源数据、深入文本语义内容的美国出口管制信息的多维分析框架,构建细粒度美国出口管制信息分析模式,为数据分析工作者提供参考。【方法】本文提出的框架基于多源数据融合思想,除了使用《出口管理条例》、《商业管制清单》,还使用实体清单等"黑名单"、与出口管制相关的联邦公报。识别多源数据中的技术名词、技术指标和受控物品关系;通过语义词典和语义模型构建语义索引;针对实体清单等"黑名单"数据,利用命名实体识别等方法构建个体与物品之间的关联关系;在此基础上,本框架包含管制现状分析、具体物品分析、时序分析、国家受控分析等4种分析模式。【结果】为验证框架的有效性,以光刻机为例,对框架及其实现进行实证研究,通过人工复核检验了框架实现方法的可行性和实用性,光刻机识别召回率在识别同尾号情况下为97.3%,中国大陆的个体领域识别准确率为83.8%。【局限】仅选取光刻机这一受控对象进行实证研究;框架实现方法还有进一步改进的空间。【结论】本文框架可以对美国出口管制做出全面、准确、有效、快速的分析,利用多源数据提供有关美国出口管制的细粒度知识,可为出口管制的文本情报分析工作提供借鉴。