摘要

无线电陆空通话是管制员与飞行员进行话音通信的方式,对航空器运行有着重要作用。在陆空通话用语的处理中,词向量是充分表征词汇语义的有效表现形式。为保证管制员飞行员人机对话系统词向量输入质量,提出了基于K-Means概念分类和基于孪生网络句子相似度计算的词向量评估方法。概念分类实验分析了单词依托向量映射到手工分类词典的准确率,结果显示准确率平均值达80.2%,浅层证明词向量具备表征语义区分单词的能力,符合空管指令分类明显的特征。句子相似度计算利用基于Siamese网络的模型计算了空管指令对的相似度值,该模型与基于wordnet层级距离、基于编辑距离方法的相似判断准确率分别为93.6%、65.8%、43.7%,前者远超其他两种方法,深层证明词向量能充分捕获词汇语义,满足对话系统对词向量质量的输入需求。