摘要

空中交通管制危险源特征提取是针对空中交通危险源记录的关键信息检索任务。基于文本特征的提取方法仅依据统计结果来对术语的重要性进行排序。通过引入专家知识来提取符合危险源定义的特征,提出了一种基于专家知识的特征提取方法来定义危险源特征并构建危险源分析框架。算法通过迭代对专家知识进行提炼和积累。实验结果表明,基于专家知识的特定语言处理后得到的数据集可以提取更多信息量的候选特征,以便通过k-means算法构建危险源记录的分析语境。该特征提取模型比其他四种算法获得了更高的精度,在空中交通管制运行数据集和通导数据集中分别达到82%和86%。此外,信息丰富的危险特征为安全管理部门的决策提供了支持,降低了隐患排查的成本。